[發明專利]文本匹配方法、裝置、存儲介質及電子設備在審
| 申請號: | 202210199238.6 | 申請日: | 2022-03-02 |
| 公開(公告)號: | CN114548314A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 馬勇強;楊杰;羅曉華 | 申請(專利權)人: | 杭州網易再顧科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N5/02;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王輝 |
| 地址: | 310052 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 匹配 方法 裝置 存儲 介質 電子設備 | ||
本公開涉及計算機技術領域,公開了一種文本匹配方法及裝置、存儲介質及電子設備。該方法包括:將用戶的輸入文本與所述輸入文本對應的候選問題文本進行特征交叉處理,得到問題交叉向量;將所述輸入文本與所述候選問題文本的答案文本進行特征交叉處理,得到答案交叉向量;將用戶交互信息進行特征向量轉換,得到第一向量表示,將所述候選問題文本的問題結構化信息進行特征向量轉換,得到第二向量表示;將對應于同一候選問題文本的問題交叉向量、答案交叉向量、第一向量表示和第二向量表示進行融合處理,得到每個候選問題文本的目標向量,并基于所述目標向量從所述候選問題文本中確定所述輸入文本的匹配結果。本公開能提升文本匹配的準確度。
技術領域
本公開的實施方式涉及計算機技術領域,更具體地,本公開的實施方式涉及文本匹配方法、文本匹配裝置、計算機可讀存儲介質及電子設備。
背景技術
本部分旨在為權利要求中陳述的本公開的實施方式提供背景或上下文,此處的描述不因為包括在本部分中就承認是現有技術。
文本匹配技術是以文本相似度、文本相關性計算的形式實現文本匹配的技術,在智能問答、知識檢索、搜索引擎、語言學習應用、信息流推薦等領域廣泛應用。相關技術中,將用戶輸入文本與候選問題文本,在文本層面進行解析、匹配并排序,以將匹配結果對應的答案文本進行展示。
發明內容
在本上下文中,本公開的實施方式期望提供一種文本匹配方法、文本匹配裝置、計算機可讀存儲介質及電子設備。
根據本公開實施方式的第一方面,提供一種文本匹配方法,包括:將用戶的輸入文本與所述輸入文本對應的候選問題文本進行特征交叉處理,得到問題交叉向量;將所述輸入文本與所述候選問題文本的答案文本進行特征交叉處理,得到答案交叉向量;將所述用戶的用戶交互信息進行特征向量轉換,得到第一向量表示,并將所述候選問題文本的問題結構化信息進行特征向量轉換,得到第二向量表示;將對應于同一候選問題文本的問題交叉向量、答案交叉向量、第一向量表示和第二向量表示進行融合處理,得到每個候選問題文本的目標向量,并基于所述目標向量從所述候選問題文本中確定所述輸入文本的匹配結果。
根據本公開實施方式的第二方面,提供一種文本匹配裝置,包括:第一特征交叉處理模塊,用于將用戶的輸入文本與所述輸入文本對應的候選問題文本進行特征交叉處理,得到問題交叉向量;第二特征交叉處理模塊,用于將所述輸入文本與所述候選問題文本的答案文本進行特征交叉處理,得到答案交叉向量;向量轉換模塊,用于將所述用戶的用戶交互信息進行特征向量轉換,得到第一向量表示,并將所述候選問題文本的問題結構化信息進行特征向量轉換,得到第二向量表示;文本匹配模塊,用于將對應于同一候選問題文本的問題交叉向量、答案交叉向量、第一向量表示和第二向量表示進行融合處理,得到每個候選問題文本的目標向量,并基于所述目標向量從所述候選問題文本中確定所述輸入文本的匹配結果。
根據本公開實施方式的第三方面,提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述任意一種文本匹配方法。
根據本公開實施方式的第四方面,提供一種電子設備,包括:處理器;以及存儲器,用于存儲所述處理器的可執行指令;其中,所述處理器配置為經由執行所述可執行指令來執行上述任意一種文本匹配方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州網易再顧科技有限公司,未經杭州網易再顧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210199238.6/2.html,轉載請聲明來源鉆瓜專利網。





