[發明專利]一種數據檢索的方法在審
| 申請號: | 202110711921.9 | 申請日: | 2021-06-25 |
| 公開(公告)號: | CN113326291A | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 王帶南 | 申請(專利權)人: | 深圳市德邦物流有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F16/2453;G06F16/242 |
| 代理公司: | 湖南楚墨知識產權代理有限公司 43268 | 代理人: | 梁琴琴 |
| 地址: | 518000 廣東省深圳市鹽*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 檢索 方法 | ||
1.一種數據檢索的方法,其特征在于,包括以下步驟:
S1、確定SQL數據源;
S2、全文檢索數據庫建立
包括利用數據庫爬蟲爬取數據庫記錄,然后通過數據分析器篩選記錄,最后將所獲取的記錄信息利用切詞器切分,最后建立倒排索引文件;
S3、全文檢索數據庫查詢;
S4、數據庫增量數據監控和調整。
2.根據權利要求1所述的一種數據檢索的方法,其特征在于,在S4中,包括:
初始化:
針對數據源中的某些需要監控變化的列在配置文件中做好配置;
指定數據源中能唯一標識一行數據的關鍵字;
讀取數據源將數據源中的關鍵字的值以及由監控變化列組成的向量存入關鍵字詞典。
3.根據權利要求2所述的一種數據檢索的方法,其特征在于,在S4中,包括:
詞典監控:
①讀取數據源的一行記錄,通過配置文件信息和關鍵字信息獲取該行的一個關鍵字詞典行;
②通過關鍵字在關鍵字詞典中查找,若查不到,則將該記錄插入關鍵字詞典中,轉④若查到則轉③;
③對列向量的每一列進行mds加密算法后同查到的關鍵字詞典中的列的集合向量進行比較,若向量相等則不做任何處理,若不等,則轉④;
④標記詞典中該行的deleteable標記位為true,并用該行的列的集合向量替換詞典中的列向量值,轉⑤;
⑤循環執行以上步驟,若該行是數據源數據的最后一行,遍歷關鍵字詞典表,將詞典表中deleteabte為true的行寫入增量關鍵字詞典中,同時將關鍵字詞典中的該行的deleteable置為false。
4.根據權利要求1所述的一種數據檢索的方法,其特征在于,在S1中,指定一個SQL為數據庫爬蟲的入口。
5.根據權利要求1所述的一種數據檢索的方法,其特征在于,在S3中,用戶通過提供的用戶界面輸入用戶的查詢請求,然后切詞器將用戶的輸入請求進行切分,之后將切分之后的結果傳給檢索器,檢索器通過切詞的結果查詢全文檢索數據庫,并按照相關度排序結果,并返回給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市德邦物流有限公司,未經深圳市德邦物流有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110711921.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:虛擬物料編碼方法、系統、電子設備及存儲介質
- 下一篇:一種機械式自閉雙開門
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





