[發明專利]相似句匹配方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202011483693.6 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112507081B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 宋青原;王健宗;吳天博 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06N3/0455;G06N5/04 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 武志峰 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相似 匹配 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種相似句匹配方法,其特征在于,孿生網絡模型包括多層編碼器和多層推理模塊,所述相似句匹配方法包括:
通過預設的詞向量訓練工具分別將第一待測句子以及第二待測句子轉換為第一向量以及第二向量;
通過所述多層編碼器對所述第一向量進行編碼得到第三向量,通過所述多層編碼器對所述第二向量進行編碼得到第四向量;
通過所述多層推理模塊對所述第三向量及第四向量進行信息交互處理從而得到第五向量;
計算所述第五向量的全局平局值;
對所述全局平局值進行歸一化處理得到概率值;
根據所述概率值判斷所述第一待測句子與第二待測句子的匹配結果;
其中,所述多層推理模塊包括多層推理網絡,各層推理網絡均計算所述第三向量與第四向量信息交互的注意力值,所述計算所述第五向量的全局平局值,包括:
根據各層所述推理網絡計算的第三向量與第四向量信息交互的注意力值,計算第三向量與第四向量信息交互的注意力值的總和;
對第三向量與第四向量信息交互的注意力值的總和求取平均值從而得到第五向量的全局平局值;
所述通過所述多層推理模塊對所述第三向量及第四向量進行信息交互處理從而得到第五向量,包括:
通過方程計算所述第三向量與第四向量信息交互的注意力值從而得到第五向量,
其中MQ為第一待測句子的查詢向量矩陣,NK為第二待測句子的鍵向量矩陣,NV為第二待測句子的值向量矩陣,M為第一待測句子,N為第二待測句子,d2為多層推理模塊網絡層的維度。
2.根據權利要求1所述的相似句匹配方法,其特征在于,所述通過所述多層編碼器對所述第一向量進行編碼得到第三向量,通過所述多層編碼器對所述第二向量進行編碼得到第四向量,包括:
通過方程計算所述第一向量的自注意力值從而得到第三向量,其中MQ為第一待測句子的查詢向量矩陣,MK為第一待測句子的鍵向量矩陣,MV為第一待測句子的值向量矩陣,M為第一待測句子,d1為多層編碼器網絡層的維度;
通過方程計算所述第二向量的自注意力值從而得到第四向量,其中NQ為第二待測句子的查詢向量矩陣,NK為第二待測句子的鍵向量矩陣,NV為第二待測句子的值向量矩陣,N為第二待測句子,d1為多層編碼器網絡層的維度。
3.根據權利要求1所述的相似句匹配方法,其特征在于,所述匹配結果包括相似以及不相似,所述根據所述概率值判斷所述第一待測句子與第二待測句子的匹配結果,包括:
判斷所述概率值是否大于預設閾值;
若所述概率值大于所述預設閾值,則判斷所述第一待測句子與第二待測句子相似;
若所述概率值小于所述預設閾值,則判斷所述第一待測句子與第二待測句子不相似。
4.根據權利要求1所述的相似句匹配方法,其特征在于,所述通過預設的詞向量訓練工具分別將第一待測句子以及第二待測句子轉換為第一向量以及第二向量之前,所述相似句匹配方法還包括:
使用對比自監督方法對多層編碼器進行訓練;
將經過訓練的多層編碼器與多層推理模塊組成孿生網絡模型;
對孿生網絡模型進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011483693.6/1.html,轉載請聲明來源鉆瓜專利網。





