[發明專利]檢索方法、裝置、設備及計算機可讀存儲介質在審
| 申請號: | 202010162321.7 | 申請日: | 2020-03-10 |
| 公開(公告)號: | CN111460114A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 梁志成 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
本發明涉及人工智能技術領域,公開了一種檢索方法,接收用戶輸入的咨詢語句,并提取關鍵詞;將關鍵字輸入至預設的過濾器中,查詢數據庫集群中包含與問題信息對應的答案的數據庫集;根據預設的文字向量轉換工具,將問題信息轉換為句子向量;將句子向量共享給數據庫集中的每個數據庫,并控制每個數據庫進行相似向量的搜索,得到答案向量集合;通過文字向量轉化工具,將答案向量集合轉換為句子,得到與問題信息對應的答案集合;本發明還提供了一種檢索裝置、設備及存儲介質,通過對檢索的數據進行分開多數據庫存儲的方式來實現檢索,縮短了整體的檢索時間,大大提升檢索的速度,從而提升了用戶的使用體驗。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種檢索方法、裝置、設備及計算機可讀存儲介質。
背景技術
隨著檢索技術和數據庫的不斷發展,其檢索的數據越來越多,每個數據庫中數據存儲也越來越多,而目前的檢索數據庫中,其會存儲有比較完整的數據信息,當需要從數據庫中調取一些數據出來使用時,則需要從數據庫中進行大量的查詢,這種查詢時間會隨著數據庫中存儲的數據量增加而延長。
對此,現在的實現方式是通過自然語言來進行處理,而自然語言處理過程中必定會遇到句子轉句子向量的過程,當句子轉換成這種稠密向量的表示的形式,查找過程將會異常耗時。例:我愛中國。轉換成200維的句子向量,占用計算機內存將會是幾何倍數增長,內存占用由原來的12字節迅速飆升至800字節。成千上萬的句子轉換成多維句子向量,將及其耗費計算機的內存資源和計算資源。
發明內容
本發明的主要目的在于提供一種檢索方法、裝置、設備及計算機可讀存儲介質,旨在解決現有的答案檢索方式,由于句子轉換成多維向量,導致查詢時間延長的的技術問題。
為解決上述的問題,在本發明的第一方面中提供了一種檢索方法,應用于人機交互系統,所述檢索方法包括:接收用戶輸入的咨詢語句,其中,所述咨詢語句包括用戶待詢問的問題信息;根據所述問題信息檢索得到包含候選答案的數據庫集群;基于關鍵字提取算法,從所述問題信息中提取出關鍵詞,所述關鍵詞用于指示所述問題信息對應的答案所在的數據庫;將所述關鍵字輸入至預設的過濾器中,查詢所述數據庫集群中包含與所述問題信息對應的答案的數據庫集;根據預設的文字向量轉換工具,將所述問題信息轉換為句子向量;將所述句子向量共享給所述數據庫集中的每個數據庫,并控制每個數據庫進行相似向量的搜索,得到答案向量集合;通過所述文字向量轉化工具,將所述答案向量集合轉換為句子,得到與所述問題信息對應的答案集合。
可選的,本發明第一方面的一個可行實施方式中在所述根據所述問題信息檢索得到包含候選答案的數據庫集群之前,還包括:收集所述人機交互系統中,智能客服與客戶之間的歷史對話記錄;提取所述歷史對話記錄中的問題信息和對應的答案,并對所述答案按照所述問題信息進行分類;通過預設的布隆算法,對分類后的所述問題信息和答案進行深度訓練學習,得到布隆過濾器,其中,所述深度訓練學習包括對所述問題信息和所述問題信息與答案之間的對應關系的學習;將同一個問題信息對應的答案建立對應關系,并存儲于所述數據庫集群中,利用預設的近鄰搜索算法對所述數據庫集群中存儲的答案進行預處理,生成N棵相似向量的搜索樹,N≧10。
可選的,本發明第一方面的一個可行實施方式中所述將所述關鍵字輸入至預設的過濾器中,查詢所述數據庫集群中包含與所述問題信息對應的答案的數據庫集包括:依次調用與所述數據庫集群中數據庫對應的布隆過濾器,判斷所述關鍵詞是否屬于在數據庫中;若存在,則選定所述數據庫為與所述問題信息對應的數據庫,直至判斷完所述數據庫集群中所有的數據庫,得到與所述問題信息對應的數據庫集。
可選的,本發明第一方面的一個可行實施方式中所述判斷所述關鍵詞是否屬于在數據庫中包括:通過所述布隆過濾器判斷所述關鍵詞是否屬于其對應的數據庫的檢索索引。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010162321.7/2.html,轉載請聲明來源鉆瓜專利網。





