[發明專利]一種數據檢索方法和系統在審
| 申請號: | 202110269603.1 | 申請日: | 2021-03-12 |
| 公開(公告)號: | CN112988747A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 李寶然 | 申請(專利權)人: | 山東英信計算機技術有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2458;G06F16/248 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰;陳黎明 |
| 地址: | 250101 山東省濟南市高新區*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 檢索 方法 系統 | ||
本發明公開了一種數據檢索方法和系統,方法包括:使用乘積量化編碼算法來分別編碼多個數據庫數據和被檢索數據,以各自獲得多個第一乘積量化編碼和第二乘積量化編碼;初始化鍵值生成模塊并生成多個哈希表;將多個第一乘積量化編碼和第二乘積量化編碼均映射到多個哈希表內的不同鍵值,使得每個哈希表內均包括部分哈希編碼鍵值;使用鍵值生成模塊在多個哈希表內分別以第二乘積量化編碼的部分哈希編碼鍵值比對多個第一乘積量化編碼的部分哈希編碼鍵值,并分別返回多個哈希表的最鄰近檢索結果;將多個最鄰近檢索結果合并,并返回相關性最高的預定數量的數據庫數據。本發明能夠提高數據檢索的效率,降低耗時。
技術領域
本發明涉及數據檢索領域,更具體地,特別是指一種數據檢索方法和系統。
背景技術
量化技術通過將高精度、高維度數據以低精度、整值、二值化方式表示,降低數據空間占用和編碼長度,并對數據進行分類和檢索。乘積量化將數據在維度上分割為多個子空間,每個子空間具有更少的維度信息。通過在每個子空間內對數據進行量化,乘積量化方法可以非常有效地對高維數據生成較長碼值長度的編碼信息。在降低乘積量化的量化誤差方面,一些改進算法使用參數化和非參數化的方法提升量化過程中編碼對數據的擬合,獲得了更好的量化性能,但其基礎都來自于乘積量化的子空間策略。
現有的基于乘積量化編碼的檢索策略設計中,通常將乘積量化編碼作為檢索加速的終點,認為乘積量化編碼的短碼值已經比原始數據更適合加速檢索了。然而實際上,盡管量化編碼的維度空間往往大幅低于原始數據的維度空間,但在編碼空間內使用遍歷方式檢索時間開銷同樣巨大,無法直接應用于實際生產場景(指紋匹配、人臉識別等)中。
針對現有技術中乘積量化編碼的數據檢索時間長、效率低的問題,目前尚無有效的解決方案。
發明內容
有鑒于此,本發明實施例的目的在于提出一種數據檢索方法和系統,能夠提高數據檢索的效率,降低耗時。
基于上述目的,本發明實施例的第一方面提供了一種數據檢索方法,包括執行以下步驟:
使用乘積量化編碼算法來分別編碼多個數據庫數據和被檢索數據,以各自獲得多個第一乘積量化編碼和第二乘積量化編碼;
使用多個第一乘積量化編碼來初始化鍵值生成模塊,并生成多個哈希表;
將多個第一乘積量化編碼和第二乘積量化編碼均映射到多個哈希表內的不同鍵值,使得每個哈希表內均包括多個第一乘積量化編碼和第二乘積量化編碼的部分哈希編碼鍵值;
使用鍵值生成模塊在多個哈希表內分別以第二乘積量化編碼的部分哈希編碼鍵值比對多個第一乘積量化編碼的部分哈希編碼鍵值,并分別返回多個哈希表的最鄰近檢索結果;
將多個最鄰近檢索結果合并,基于多個第一乘積量化編碼分別到第二乘積量化編碼的相關性排序,并返回相關性最高的預定數量的數據庫數據。
在一些實施方式中,使用乘積量化編碼算法來分別編碼多個數據庫數據和被檢索數據,以各自獲得多個第一乘積量化編碼和第二乘積量化編碼包括:
確定乘積量化編碼算法的碼位數和每位取值指數,并基于碼位數和每位取值指數使用乘積量化編碼算法來各自獲得具有碼位數和每位取值指數的多個第一乘積量化編碼和第二乘積量化編碼。
在一些實施方式中,將多個第一乘積量化編碼和第二乘積量化編碼均映射到多個哈希表內的不同鍵值包括:
基于碼位數和哈希表的數量之比確定哈希表的映射長度,并將多個第一乘積量化編碼和第二乘積量化編碼中映射長度的哈希編碼鍵值作為部分哈希編碼鍵值而映射到多個哈希表內的不同鍵值。
在一些實施方式中,被映射到同一哈希表內的多個第一乘積量化編碼和第二乘積量化編碼中的映射長度的哈希編碼鍵值在多個第一乘積量化編碼和第二乘積量化編碼上均占據相同的位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東英信計算機技術有限公司,未經山東英信計算機技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110269603.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:主梁的配重式安裝系統
- 下一篇:一種血液透析護理用上肢固定支撐架
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





