[發明專利]企業名稱檢索方法、企業名稱檢索裝置及終端設備在審

申請號：	202011604087.5	申請日：	2020-12-29
公開（公告）號：	CN112597208A	公開（公告）日：	2021-04-02
發明（設計）人：	趙洋;朱繼剛;包榮鑫;王瑗;梅金芳	申請（專利權）人：	深圳價值在線信息科技股份有限公司
主分類號：	G06F16/2457	分類號：	G06F16/2457;G06F16/242;G06K9/62;G06N20/00
代理公司：	深圳中一聯合知識產權代理有限公司 44414	代理人：	田甜
地址：	518000 廣東省深圳市福田區沙頭街道***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	企業名稱檢索方法裝置終端設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請適用于數據處理技術領域，提供了一種企業名稱檢索方法、企業名稱檢索裝置及終端設備，方法包括：根據訓練后的句向量生成模型獲取第一檢索語句的第一句向量；獲取多個候選企業名稱各自的第二句向量；根據所述第一句向量和所述第二句向量之間的距離，從所述多個候選企業名稱中確定出多個召回企業名稱；根據訓練后的排序模型，從所述多個召回企業名稱中確定出所述第一檢索語句對應的目標企業名稱。通過上述方法，能夠有效提高企業名稱檢索的準確度，同時提高檢索效率。

技術領域

本申請屬于數據處理技術領域，尤其涉及一種企業名稱檢索方法、企業名稱檢索裝置及終端設備。

背景技術

隨著經濟的快速增長，注冊企業的數量呈逐年上升的趨勢。許多企業的名稱全稱較長，對于用戶而言，可能只記住了企業名稱的簡稱、或其中幾個詞語。這種情況下，從大量的企業名稱中很難查找到目標名稱。

現有的企業名稱檢索方法中，通常是將檢索語句劃分為字或詞，然后以字或詞為單位進行檢索。現有方法僅考慮了詞之間或字之間的匹配度，但是并未考慮檢索語句的語義信息，導致檢索結果并不準確。

發明內容

本申請實施例提供了一種企業名稱檢索方法、企業名稱檢索裝置及終端設備，可以提高企業名稱檢索的準確度。

第一方面，本申請實施例提供了一種企業名稱檢索方法，包括：

根據訓練后的句向量生成模型獲取第一檢索語句的第一句向量；

獲取多個候選企業名稱各自的第二句向量；

根據所述第一句向量和所述第二句向量之間的距離，從所述多個候選企業名稱中確定出多個召回企業名稱；

根據訓練后的排序模型，從所述多個召回企業名稱中確定出所述第一檢索語句對應的目標企業名稱。

本申請實施例中，通過訓練后的句向量生成模型獲取第一檢索語句的第一句向量，避免了將檢索語句劃分為字或詞，而是將第一檢索語句作為整體進行處理，能夠保留第一檢索語句的語義信息；然后通過計算第一句向量和第二句向量之間的距離，確定目標企業名稱，即找到與第一檢索語句語義相近的企業名稱，有效提高了檢索結果的準確性。另外，句向量生成模型和排序模型均為訓練后的模型，利用訓練后的模型進行數據處理，能夠大大節約句向量的生成時間和排序時間，進而提高了檢索的效率。

在第一方面的一種可能的實現方式中，所述根據所述第一句向量和所述第二句向量之間的距離，從所述多個候選企業名稱中確定出多個召回企業名稱，包括：

計算所述第一句向量與每個所述第二句向量之間的歐式距離；

將計算出的所述歐式距離按照從小到大的順序排序，獲得距離隊列；

將所述距離隊列中前M個所述歐式距離各自對應的所述候選企業名稱確定為所述召回企業名稱，其中，所述M為正整數。

在第一方面的一種可能的實現方式中，所述根據訓練后的排序模型，從所述多個召回企業名稱中確定出所述第一檢索語句對應的目標企業名稱，包括：

將所述第一句向量和所述多個召回企業名稱各自的所述第二句向量輸入到所述訓練后的排序模型中，輸出所述多個召回企業名稱各自的匹配概率；

將所述匹配概率按照從大到小的順序排序，獲得概率隊列；

將所述概率隊列中前N個所述匹配概率各自對應的所述召回企業名稱確定為所述目標企業名稱，其中，所述N為正整數，且N小于或等于所述召回企業名稱的數量。

在第一方面的一種可能的實現方式中，所述方法還包括：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于深圳價值在線信息科技股份有限公司，未經深圳價值在線信息科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】