[發明專利]文本匹配方法、裝置及設備在審
| 申請號: | 201810274548.3 | 申請日: | 2018-03-30 |
| 公開(公告)號: | CN110555093A | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 周維;徐健鵬;李維 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F17/27 |
| 代理公司: | 11363 北京弘權知識產權代理事務所(普通合伙) | 代理人: | 逯長明;許偉群 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 文本匹配 詞向量 向量 裝置及設備 準確度 匹配計算 匹配距離 綜合文本 申請 匹配 詞匯 | ||
本申請實施例公開了一種文本匹配方法、裝置及設備。所述方法包括:獲取第一文本和第二文本;根據所述第一文本的句向量和詞向量以及所述第二文本的句向量和詞向量計算所述第一文本和所述第二文本的含義匹配距離。本申請實施例的文本匹配方法,綜合文本中各個詞匯的含義以及文本整句的含義,確定兩文本的匹配程度,使得匹配計算的信息全面完整,從而能夠提高文本匹配的準確度,提高用戶的使用體驗。
技術領域
本申請實施例涉及計算機技術領域,尤其涉及一種文本匹配方法、裝置及設備。
背景技術
目前,智能問答系統廣泛應用于服務領域,一種可選的智能問答流程包括:預先將用戶的常見問題(Frequently Asked Questions,FAQ)整理形成問題庫,并將問題庫以及其中每個問題對應的答案存儲在智能問答系統中,當智能問答系統接收到用戶輸入的問題時,從問題庫中匹配與輸入問題最接近的目標問題,進而,向用戶顯示目標問題對應的答案。
現有技術中,智能問答系統基于文本搜索或者句向量模型執行匹配操作。基于文本搜索的匹配原理是,提取輸入問題的關鍵詞,將問題庫中包含所提取的關鍵詞最多的問題,確定為目標問題。基于句向量模型匹配原理是,按照預設的句向量模型計算輸入問題的句向量,將問題庫中句向量與輸入問題的句向量最接近的問題,確定為目標問題。
其中,由于基于文本搜索執行字符串匹配操作,不考慮所提取的關鍵詞的含義,并且所提取的關鍵詞很大程度上也無法準確體現輸入問題的含義,從而導致匹配的準確度較低。而通過句向量模型執行匹配操作,所得到的句向量僅能體現問題句子整句的大致含義,所捕捉的句子含義并不準確,從而導致匹配的準確度也較低。
發明內容
本申請實施例提供了一種文本匹配方法、裝置及設備,以解決現有匹配方法的匹配準確度低的問題。
第一方面,本申請實施例提供了一種文本匹配方法,該方法包括,
獲取第一文本和第二文本;
根據所述第一文本的句向量和詞向量以及所述第二文本的句向量和詞向量計算所述第一文本和所述第二文本的含義匹配距離,所述含義匹配距離用于指示所述第一文本與所述第二文本的含義匹配程度。
由于詞向量用于表示文本中詞匯的含義,句向量用于表示文本整句的含義,因此,根據第一文本的句向量和詞向量以及第二文本的句向量和詞向量計算得到的含義匹配距離,能夠體現出第一文本和第二文本的詞匯含義的匹配程度,以及第一文本和第二文本整句含義的匹配程度。
由此可見,本申請實施例的匹配方法,綜合第一文本和第二文本詞匯含義和整句含義的匹配程度,確定二者的匹配程度,能夠將詞匯含義作為文本匹配的一項信息,從而能夠提高文本匹配的準確度。
一種可選的設計中,所述根據所述第一文本的句向量和詞向量以及所述第二文本的句向量和詞向量,計算所述第一文本和所述第二文本的含義匹配距離包括:
分別確定出所述第一文本的K個詞向量和所述第二文本的K個詞向量,K是正整數;
根據所述第一文本的K個詞向量和所述第二文本的K個詞向量計算詞向量匹配距離;
根據所述詞向量匹配距離和句向量匹配距離,計算出所述含義匹配距離,所述句向量匹配距離根據所述第一文本的句向量與所述第二文本的句向量計算得到。
其中,詞向量用于表示文本中詞匯的含義,詞向量之間的距離能夠表達量詞匯之間的匹配程度。基于此,采用本實現方式,能夠將詞匯的匹配程度作為文本匹配的參數之一,從而提高文本匹配的準確度。
一種可選的設計中,所述分別確定出所述第一文本和所述第二文本的K個詞向量包括:
確定所述第一文本包含的L個詞匯字符串,L是大于K的整數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810274548.3/2.html,轉載請聲明來源鉆瓜專利網。





