[發明專利]文本匹配方法、系統和計算機設備有效
| 申請號: | 202010743264.1 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111859939B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 龐帥;張揚;馬建強 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/284;G06F40/126;G06F16/335;G06F16/33 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 王勇 |
| 地址: | 518033 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 匹配 方法 系統 計算機 設備 | ||
1.一種文本匹配方法,其特征在于,所述方法包括:
接收客戶終端發送的目標文本;
對所述目標文本進行編碼操作,以得到目標編碼;
根據所述目標編碼獲取多個候選編碼,其中,所述多個候選編碼是對多個候選文本預先編碼處理而得到的;
根據所述目標編碼與所述多個候選編碼計算所述目標文本與多個候選編碼對應的多個候選文本的相識度,以得到與所述目標文本相識度最高的候選文本;
輸出與所述目標文本相識度最高的候選文本;
其中,所述根據所述目標編碼與所述多個候選編碼計算所述目標文本與多個候選編碼對應的多個候選文本的相識度,以得到與所述目標文本相識度最高的候選文本,包括:
對所述目標編碼與多個候選編碼進行交互編碼操作,以得到目標文本對應的多個目標詞向量和每個候選文本對應的多個候選詞向量;
根據所述多個目標詞向量和所述多個候選詞向量確定聯合向量;及
根據所述聯合向量計算所述多個候選文本與所述目標文本的相識度,以得到與所述目標文本相識度最高的候選文本;
其中,所述根據所述多個目標詞向量和多個候選詞向量確定聯合向量,包括:
通過CLS填充所述目標文本和每個候選文本中的第一個詞之前,以將所述CLS作為所述目標文本和每個候選文本的第一個詞;
對所述目標文本對應的目標CLS和所述候選文本的對應的候選CLS分別進行編碼操作,以得到目標CLS編碼和候選CLS編碼;
根據所述目標CLS編碼得到目標首向量ACLS,同時根據候選CLS編碼得到候選首向量BCLS;
將目標文本的每個目標詞向量編碼到所述目標CLS中,得到目標組合向量A′CLS,以及將候選文本的每個候選詞向量編碼到所述候選CLS中,得到候選組合向量B′CLS;
將所述目標CLS編碼和所述目標組合向量A′CLS進行拼接,以得到目標拼接向量NACLS,同時將所述候選CLS編碼和所述候選組合向量B′CLS進行拼接,以得到候選拼接向量NBCLS;及
根據所述目標拼接向量NACLS和所述候選拼接向量NBCLS聯合處理,以得到聯合向量。
2.如權利要求1所述的文本匹配方法,其特征在于,所述根據所述目標拼接向量NACLS和所述候選拼接向量NBCLS聯合處理,以得到聯合向量,包括:
通過預先準備的映射函數對所述目標拼接向量NACLS和所述候選拼接向量NBCLS分別進行映射操作,以得到目標交互向量RA和候選交互向量RB;
對所述目標交互向量RA和候選交互向量RB進行交互處理,以得到聯合向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010743264.1/1.html,轉載請聲明來源鉆瓜專利網。





