[發明專利]一種語義相似度計算方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110579152.1 | 申請日: | 2021-05-26 |
| 公開(公告)號: | CN113312462A | 公開(公告)日: | 2021-08-27 |
| 發明(設計)人: | 呂超;韓佳;史祎凡;高峰;劉謙;姚雷;王建輝;杜新凱 | 申請(專利權)人: | 陽光保險集團股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F40/289;G06N3/04 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 余菲 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語義 相似 計算方法 裝置 電子設備 存儲 介質 | ||
1.一種語義相似度計算方法,其特征在于,包括:
獲取第一語句與第二語句;所述第一語句與所述第二語句中均包括至少一個句子;
根據所述第一語句,確定所述第一語句包括的至少一個第一關鍵詞,以及根據所述第二語句,確定所述第二語句包括的至少一個第二關鍵詞;所述第一關鍵詞是指所述第一語句中除指定詞語之外的其他詞語,所述第二關鍵詞是指所述第二語句中除指定詞語之外的其他詞語;
對于每個所述第一關鍵詞,確定該第一關鍵詞對應的第一詞向量;以及對于每個所述第二關鍵詞,確定該第二關鍵詞對應的第二詞向量;
將所有的所述第一詞向量輸入到第一時間卷積網絡中,輸出用于表示所述第一語句的語義的第一向量;以及將所有的所述第二詞向量輸入到第二時間卷積網絡中,輸出用于表示所述第二語句的語義的第二向量;其中所述第一時間卷積網絡與所述第二時間卷積網絡通過孿生神經網絡共享參數;
根據所述第一向量與所述第二向量,計算所述第一語句與所述第二語句之間的語義相似度。
2.根據權利要求1所述的語義相似度計算方法,其特征在于,所述根據所述第一語句,確定所述第一語句包括的至少一個第一關鍵詞,包括:
刪除所述第一語句中的停用詞;
對刪除停用詞后的所述第一語句進行分詞處理,得到所述第一語句包括的至少一個第一關鍵詞;
根據所述第二語句,確定所述第二語句包括的至少一個第二關鍵詞,包括:
刪除所述第二語句中的停用詞;
對刪除停用詞后的所述第二語句進行分詞處理,得到所述第二語句包括的至少一個第二關鍵詞。
3.根據權利要求1所述的語義相似度計算方法,其特征在于,所述對于每個所述第一關鍵詞,確定該第一關鍵詞對應的第一詞向量,包括:
對于每個所述第一關鍵詞,從預先定義的詞典中,匹配出與該第一關鍵詞對應的第一詞向量;所述預先定義的詞典中存儲有所述第一關鍵詞與所述第一詞向量之間的對應關系;
所述對于每個所述第二關鍵詞,確定該第二關鍵詞對應的第二詞向量,包括:
對于每個所述第二關鍵詞,從所述預先定義的詞典中,匹配出與該第二關鍵詞對應的第二詞向量;所述預先定義的詞典中存儲有所述第二關鍵詞與所述第二詞向量之間的對應關系。
4.根據權利要求1所述的語義相似度計算方法,其特征在于,所述將所有的所述第一詞向量輸入到第一時間卷積網絡中,輸出用于表示所述第一語句的語義的第一向量,包括:
按照所述第一關鍵詞在所述第一語句中的先后順序,將所述第一詞向量進行組合,得到所述第一語句對應的第一詞向量序列;
將所述第一詞向量序列輸入到第一時間卷積網絡中,輸出用于表示所述第一語句的語義的第一向量;
所述將所有的所述第二詞向量輸入到第二時間卷積網絡中,輸出用于表示所述第二語句的語義的第二向量,包括:
按照所述第二關鍵詞在所述第二語句中的先后順序,將所述第二詞向量進行組合,得到所述第二語句對應的第二詞向量序列;
將所述第二詞向量序列輸入到第二時間卷積網絡中,輸出用于表示所述第二語句的語義的第二向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陽光保險集團股份有限公司,未經陽光保險集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110579152.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種游戲界面顯示的方法、裝置、設備及介質
- 下一篇:一種往復式車身側頂裝置





