[發明專利]檢索方法及裝置在審
| 申請號: | 201910327190.0 | 申請日: | 2019-04-23 |
| 公開(公告)號: | CN110109924A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 涂騰飛;余偉;張進 | 申請(專利權)人: | 重慶紫光華山智安科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/28 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 徐彥圣 |
| 地址: | 400700 重慶市*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索詞 檢索 集合 關系型數據庫 數據庫 查詢指令 返回結果 檢索語句 篩選 服務器設置 檢索結果 分詞器 復雜度 映射表 分詞 原表 服務器 匹配 查詢 | ||
1.一種檢索方法,其特征在于,所述方法應用于服務器;所述服務器設置有關系型數據庫,所述方法包括:
獲取用戶輸入的檢索詞或檢索語句;
根據所述檢索詞或分詞器對所述檢索語句分詞后生成的初始檢索詞集合,從所述關系型數據庫中原表的映射表對應的鍵值對數據庫中匹配得到篩選后的檢索詞集合;所述鍵值對數據庫中的鍵為所述關系型數據庫的映射表中指定的一個用于檢索的字段對應的值;所述鍵對應的值為所述映射表中指定的一個用于檢索的字段對應的值在原表中對應的字段名和表名;
從所述鍵值對數據庫中獲取所述篩選后的檢索詞集合對應的字段名和表名;
通過所述篩選后的檢索詞集合和各個檢索詞對應的字段名和表名生成每個表名對應的查詢指令;
通過所述查詢指令在每個所述表名對應的表中查詢得到返回結果;
根據每個所述表名對應的返回結果,確定所述檢索詞對應的檢索結果。
2.根據權利要求1所述的方法,其特征在于,根據所述檢索詞或分詞器對所述檢索語句分詞后生成的初始檢索詞集合,從所述關系型數據庫中原表的映射表對應的鍵值對數據庫中匹配得到篩選后的檢索詞集合的步驟,包括:
獲取待檢索的關系型數據庫中每個原表的數據;
根據所述每個原表的數據創建每個原表的索引和映射表;
加載所述映射表到鍵值對數據庫;
將所述檢索詞的集合中的每一個檢索詞作為鍵值對數據庫的鍵去鍵值對數據庫里面查詢該鍵對應的值,如果所述對應的值不為空,則返回所述對應的值不為空的鍵值對,最終所有所述對應的值不為空的鍵值對的鍵組成的集合即為篩選后的檢索詞集合。
3.根據權利要求2所述的方法,其特征在于,根據所述每個原表的數據創建每個原表的索引和映射表的步驟,包括:
針對每個原表,使用每個所述原表中供查詢的字段創建索引;
根據當前原表的數據創建所述當前原表的映射表;其中,所述映射表包括:每個所述原表中供查詢的字段名、供查詢的字段對應的值和所述供查詢的字段所在原表的表名。
4.根據權利要求3所述的方法,其特征在于,根據當前原表的數據創建所述當前原表的映射表的步驟之后,所述方法還包括:將所述供查詢的字段對應的值在去重后輸入所述映射表的指定的一個用于檢索的字段中。
5.根據權利要求2所述的方法,其特征在于,獲取用戶輸入的檢索詞或檢索語句的步驟,包括:
接收用戶輸入的檢索語句;
根據預設的分詞庫,對所述檢索語句進行分詞處理,得到所述檢索語句中的初始檢索詞集合;所述預設的分詞庫包含有每個所述原表中供查詢的字段的值。
6.根據權利要求1所述的方法,其特征在于,根據每個所述表名對應的返回結果,確定所述檢索詞對應的檢索結果的步驟,包括:
根據每條所述返回結果攜帶的檢索詞和分詞器分詞后生成的總的檢索詞的相關度,確定匹配程度;
根據所述匹配程度的大小,對所述匹配程度進行排序,確定檢索結果。
7.根據權利要求6所述的方法,其特征在于,根據每條所述返回結果攜帶的檢索詞和分詞器分詞后生成的總的檢索詞的相關度,確定匹配程度的步驟,包括:
通過以下算式根據每條所述返回結果攜帶的檢索詞和分詞器分詞后生成的總的檢索詞的相關度,確定匹配程度:
其中,I為所述匹配程度;N1為每條所述檢索結果攜帶的檢索詞個數;N2為所述分詞器分詞后生成的檢索詞集合中檢索詞的總個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶紫光華山智安科技有限公司,未經重慶紫光華山智安科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910327190.0/1.html,轉載請聲明來源鉆瓜專利網。





