[發明專利]文本的匹配方法、匹配裝置、終端及計算機可讀存儲介質有效
| 申請號: | 201811640931.2 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN111382246B | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 熊友軍;熊為星;廖洪濤 | 申請(專利權)人: | 深圳市優必選科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;H04M3/527 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 張全文 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 匹配 方法 裝置 終端 計算機 可讀 存儲 介質 | ||
1.一種文本的匹配方法,其特征在于,所述匹配方法包括:
獲取第一文本和第二文本;
獲取所述第一文本對應的第一向量以及所述第二文本對應的第二向量;
計算所述第一向量和所述第二向量的向量積;
根據第一映射函數將所述向量積映射為第一特征向量;
根據第二映射函數將所述第一向量映射為第二特征向量;
基于所述第一特征向量和所述第二特征向量,確定第二文本與所述第一文本的匹配度。
2.根據權利要求1所述的文本的匹配方法,其特征在于,所述獲取第一文本和第二文本包括:
獲取第一文本,以及所述第一文本的類別信息;
基于所述類別信息確定與所述第一文本對應的文本匹配庫;
從所述文本匹配庫中選取與所述第一文本進行匹配的第二文本。
3.根據權利要求2所述的文本的匹配方法,其特征在于,所述匹配方法還包括:
分別確定所述文本匹配庫中各文本與所述第一文本的匹配度;
將所述匹配庫中與所述第一文本的匹配度最高的文本作為所述第一文本的匹配文本。
4.根據權利要求1至3任一項所述的文本的匹配方法,其特征在于,所述第一映射函數包括多層映射關系,所述第一映射函數的數學表示為:
z(l)=relu(W(l)z(l-1)+b(l))
其中,設第一映射函數包括的映射關系的層數為L,則l=1,2,...,L,W(l)表示第l層映射關系對應的權重矩陣,b(l)表示第l層映射關系對應的偏置向量,z(l-1)表示第l層映射關系對應的輸入,z(l)表示第l層映射關系對應的映射輸出,relu表示映射輸出的激勵方式;
所述第二映射函數的數學表示為:
h=relu(Wpq1+bp)
其中,h表示第二映射函數的映射輸出,q1表示第二映射函數的輸入,Wp表示第二映射函數的權重矩陣,bp表示第二映射函數的偏置向量,relu表示映射輸出的激勵方式。
5.根據權利要求4所述的文本的匹配方法,其特征在于,所述第一映射函數的各層映射關系對應的權重矩陣和偏置向量、以及所述第二映射函數的權重矩陣和偏置向量為通過訓練得到,訓練的步驟包括:
獲取訓練樣本,其中,所述訓練樣本包括正向樣本和負向樣本,所述正向樣本包含的文本對之間的匹配度大于所述負向樣本包含的文本對之間的匹配度;
利用所述訓練樣本對所述第一映射函數和所述第二映射函數進行迭代計算;
根據預設的損失函數計算所述訓練樣本中正向樣本對應的輸出結果和負向樣本對應的輸出結果的損失值,并根據所述損失值進行梯度更新,確定所述第一映射函數的各層映射關系對應的權重矩陣和偏置向量、以及所述第二映射函數的權重矩陣和偏置向量。
6.根據權利要求5所述的文本的匹配方法,其特征在于,所述獲取訓練樣本包括:
采集訓練用的文本;
對所述訓練用的文本進行分類,確定各文本的所屬類別;
根據所述各文本的所屬類別,確定所述各文本之間的匹配度;
基于所述各文本之間的匹配度構建文本三元組(Q1,Q2,Q3)作為訓練樣本,其中,Q1與Q2組成正向樣本,Q1與Q3組成負向樣本,所述正向樣本之間的匹配度大于所述負向樣本之間的匹配度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市優必選科技有限公司,未經深圳市優必選科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811640931.2/1.html,轉載請聲明來源鉆瓜專利網。





