[發明專利]文本處理方法、裝置、電子設備和存儲介質在審
| 申請號: | 202111644876.6 | 申請日: | 2021-12-29 |
| 公開(公告)號: | CN114330365A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 余曉峰;鄭博文 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 豐佩印 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 處理 方法 裝置 電子設備 存儲 介質 | ||
本公開提供了一種文本處理方法、裝置、電子設備和存儲介質,涉及數據處理技術領域,尤其涉及深度學習技術領域和語義匹配技術領域,該方法包括:獲取待查詢的第一文本;對第一文本進行特征處理,得到第一特征向量;將第一特征向量與多個第二特征向量進行對比,確定與第一特征向量匹配的目標特征向量;基于目標特征向量確定與第一文本匹配的查詢結果。容易注意到的是,第一特征向量是用戶側的特征,第二特征向量是查詢側的特征向量,本公開可以將查詢側的特征和內容側的特征同時進行處理,可以進行全局處理,從而解決了難以同時保證語義匹配精度和處理效率的技術問題,進而達到了提高查詢結果的精確度。
技術領域
本公開涉及數據處理技術領域,尤其涉及深度學習技術領域和語義匹配技術領域,具體涉及一種文本處理方法、裝置、電子設備和存儲介質。
背景技術
在NLP(Natural Language Processing,自然語言處理)的諸多應用中,有很多應用都有在語義上衡量文本相似度的需求,我們將這類需求統稱為語義匹配,此外,語義匹配的應用范圍非常廣,例如在搜索、問答系統、電商等。但目前基于如何獲得較好的語義匹配效果的技術問題,尚未有解決方案。
發明內容
本公開提供了一種文本處理方法、裝置、電子設備和存儲介質。
根據本公開的第一方面,提供了一種文本處理方法,包括:獲取待查詢的第一文本;對第一文本進行特征處理,得到第一特征向量;將第一特征向量與多個第二特征向量進行對比,確定與第一特征向量匹配的目標特征向量,其中,多個第二特征向量通過對目標卡片的至少兩組特征向量進行特征交叉計算而得到;基于目標特征向量確定與第一文本匹配的查詢結果。
根據本公開的第二方面,提供了一種文本處理裝置,包括:獲取模塊,用于獲取待查詢的第一文本;特征處理模塊,用于對第一文本進行特征處理,得到第一特征向量;對比模塊,用于將第一特征向量與多個第二特征向量進行對比,確定與第一特征向量匹配的目標特征向量,其中,多個第二特征向量通過對目標卡片的至少兩組特征向量進行特征交叉計算而得到;確定模塊,用于基于目標特征向量確定與第一文本匹配的查詢結果。
根據本公開的第三方面,提供了一種電子設備,包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行本公開提出的文本處理方法。
根據本公開的第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,計算機指令用于使計算機執行本公開提出的文本處理方法。
根據本公開的第五方面,提供了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行本公開提出的文本處理方法。
在本公開的實施例中,提供了一種可以用于語義匹配的文本處理方法、裝置、電子設備和存儲介質。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本公開的限定。其中:
圖1是根據本公開實施例的一種文本處理方法的流程圖;
圖2是卡片信息在終端的顯示界面上的示意圖;
圖3是根據本公開優選實施例的一種文本處理方法的流程圖;
圖4是根據本公開實施例的一種文本處理裝置的結構示意圖;
圖5示出了可以用來實施本公開的實施例的示例電子設備500的示意性框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111644876.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種集成曲面折疊屏的汽車頂棚結構
- 下一篇:賬戶創建方法及裝置





