[發明專利]句子相似度確定方法及系統有效
| 申請號: | 202010112980.X | 申請日: | 2020-02-24 |
| 公開(公告)號: | CN111368537B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 俞凱;陳露 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F40/263 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 句子 相似 確定 方法 系統 | ||
1.一種句子相似度確定方法,用于確定第一語句與第二語句之間的相似度值,所述方法包括:
構造對應于所述第一語句的第一詞圖,和對應于所述第二語句的第二詞圖;
確定所述第一詞圖的第一圖向量表示,和所述第二詞圖的第二圖像量表示;
根據所述第一圖向量表示和所述第二圖像量表示確定所述第一語句與所述第二語句之間的相似度值;
所述構造對應于所述第一語句的第一詞圖,和對應于所述第二語句的第二詞圖包括:
根據預設詞典對所述第一語句進行分詞,以分詞得到的每一個詞作為一個節點,相鄰節點之間通過有向邊連接,構成第一詞圖;
根據預設詞典對所述第二語句進行分詞,以分詞得到的每一個詞作為一個節點,相鄰節點之間通過有向邊連接,構成第二詞圖。
2.根據權利要求1所述的方法,其中,所述確定所述第一詞圖的第一圖向量表示,和所述第二詞圖的第二圖像量表示包括:
針對所述第一詞圖中的每一個節點:根據節點所對應的詞所包含的字的字向量確定節點向量;
根據所述第一詞圖中的每個節點的節點向量確定第一圖向量表示;
針對所述第二詞圖中的每一個節點:根據節點所對應的詞所包含的字的字向量確定節點向量;
根據所述第二詞圖中的每個節點的節點向量確定第二圖向量表示。
3.根據權利要求2所述的方法,其中,所述根據節點所對應的詞所包含的字的字向量確定節點向量包括:
節點向量初始化步驟:
對節點對應的詞中的每個字的向量化表示進行池化操作得到節點的初始化表示;
節點向量更新步驟:
利用圖內自注意力機制得到對應于節點的第一向量,利用圖間互注意力機制得到對應于節點的第二向量;
利用多角度余弦距離計算所述第一向量和所述第二向量之間的距離向量;
將所述第一向量和所述距離向量輸入至前饋神經網絡以得到所述節點的節點向量;
重復所述節點向量更新步驟N次。
4.根據權利要求2所述的方法,其中,在所述確定所述第一詞圖的第一圖向量表示,和所述第二詞圖的第二圖像量表示之前還包括:
確定所述第一語句中的每一個字的字向量,和所述第二語句中的每一個字的字向量。
5.根據權利要求4所述的方法,其中,確定所述第一語句中的每一個字的字向量,和所述第二語句中的每一個字的字向量包括:
將所述第一語句和所述第二語句輸入至大規模預訓練語言模型得到所述第一語句和所述第二語句中的每個字的字向量。
6.一種句子相似度確定系統,用于確定第一語句與第二語句之間的相似度值,所述系統包括:
詞圖構造模塊,用于構造對應于所述第一語句的第一詞圖,和對應于所述第二語句的第二詞圖;
圖向量確定模塊,用于確定所述第一詞圖的第一圖向量表示,和所述第二詞圖的第二圖像量表示;
相似度確定模塊,用于根據所述第一圖向量表示和所述第二圖像量表示確定所述第一語句與所述第二語句之間的相似度值;
所述構造對應于所述第一語句的第一詞圖,和對應于所述第二語句的第二詞圖包括:
根據預設詞典對所述第一語句進行分詞,以分詞得到的每一個詞作為一個節點,相鄰節點之間通過有向邊連接,構成第一詞圖;
根據預設詞典對所述第二語句進行分詞,以分詞得到的每一個詞作為一個節點,相鄰節點之間通過有向邊連接,構成第二詞圖。
7.一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求1-5中任意一項所述方法的步驟。
8.一種存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現權利要求1-5中任意一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010112980.X/1.html,轉載請聲明來源鉆瓜專利網。





