[發明專利]語義匹配方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110265862.7 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN113408293A | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 毛鐵崢;趙子元;顏強 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/194;G06F40/279;G06F16/35;G06N20/00 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 朱黎 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 匹配 方法 裝置 電子設備 存儲 介質 | ||
本申請提供了一種語義匹配方法、裝置、電子設備及存儲介質,所述方法包括:獲取第一文本以及待與所述第一文本進行匹配的至少兩個第二文本;基于文本語義,將所述第一文本向各所述第二文本進行命中,得到第一命中結果;基于文本語義,將所述第二文本分別向所述第一文本進行命中,得到第二命中結果;基于所述第一命中結果以及所述第二命中結果,確定與所述第一文本所匹配的第二文本。本申請實施例能夠提高語義匹配的準確度。
技術領域
本申請涉及人工智能領域,具體涉及一種語義匹配方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網技術的發展,在方方面面的互聯網應用中常常會涉及到語義匹配。語義匹配的準確度直接或間接決定著應用所提供服務質量的高低。現有技術中,由于在進行語義匹配時未能細致地將文本之間的相關性進行表達,從而導致語義匹配的準確度較低。
發明內容
本申請的一個目的在于提出一種語義匹配方法、裝置、電子設備及存儲介質,能夠提高語義匹配的準確度。
根據本申請實施例的一方面,公開了一種語義匹配方法,所述方法包括:
獲取第一文本以及待與所述第一文本進行匹配的至少兩個第二文本;
基于文本語義,將所述第一文本向各所述第二文本進行命中,得到第一命中結果;
基于文本語義,將所述第二文本分別向所述第一文本進行命中,得到第二命中結果;
基于所述第一命中結果以及所述第二命中結果,確定與所述第一文本所匹配的第二文本。
根據本申請實施例的一方面,公開了一種語義匹配裝置,所述裝置包括:
獲取模塊,配置為獲取第一文本以及待與所述第一文本進行匹配的至少兩個第二文本;
第一命中模塊,配置為基于文本語義,將所述第一文本向各所述第二文本進行命中,得到第一命中結果;
第二命中模塊,配置為基于文本語義,將所述第二文本分別向所述第一文本進行命中,得到第二命中結果;
匹配模塊,配置為基于所述第一命中結果以及所述第二命中結果,確定與所述第一文本所匹配的第二文本。
在本申請的一示例性實施例中,所述裝置配置為:
獲取所述第一文本與各所述第二文本的相似度;
建立以所述相似度為矩陣元素的相似度矩陣;
基于對所述相似度矩陣的變換處理,將所述第一文本向各所述第二文本進行命中的同時,將所述第二文本分別向所述第一文本進行命中,同時得到所述第一命中結果以及所述第二命中結果。
在本申請的一示例性實施例中,所述裝置配置為:
采用預設的高斯核對所述相似度矩陣進行池化處理,得到池化后矩陣;
基于所述池化后矩陣的列向量集合以及行向量集合,得到所述第一命中結果以及所述第二命中結果。
在本申請的一示例性實施例中,所述裝置配置為:
將所述第一文本以及目標第二文本進行分詞,得到所述第一文本所包含的第一關鍵詞以及所述目標第二文本所包含的第二關鍵詞;
確定所述第一關鍵詞與所述第二關鍵詞的并集;
將所述并集中關鍵詞的數目除以所述第一關鍵詞的數目,得到所述第一命中結果;
將所述并集中關鍵詞的數目除以所述第二關鍵詞的數目,得到所述第二命中結果。
在本申請的一示例性實施例中,所述裝置配置為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110265862.7/2.html,轉載請聲明來源鉆瓜專利網。





