[發明專利]一種索引生成方法、數據檢索方法和裝置有效
| 申請號: | 201611170581.9 | 申請日: | 2016-12-16 |
| 公開(公告)號: | CN106777130B | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 崔江濤;馮小康;劉暢;侯勇超;蔡洋 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F16/41 | 分類號: | G06F16/41;G06F16/43;G06F16/31;G06F16/33 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 索引 生成 方法 數據 檢索 裝置 | ||
1.一種索引生成方法,其特征在于,包括:
提取每一個樣本數據元的樣本特征信息,所述樣本特征信息,包括:樣本特征向量和樣本標識;
為每一個所述樣本特征向量生成對應的近鄰圖索引;
隨機生成至少一個映射向量;
針對每一個所述映射向量,執行:
根據預設的區間寬度,將所述映射向量劃分為至少兩個區間,并為每一個所述區間分配對應的區間標識;
將每一個所述樣本特征向量映射到所述映射向量;
根據映射的結果,將每一個所述樣本標識分配給相關的所述區間標識,生成倒排文檔索引。
2.根據權利要求1所述的方法,其特征在于,
所述為每一個所述區間分配對應的區間標識,包括:
從所述映射向量的起始位置,為每一個所述區間進行順序編號;
確定每一個所述區間的編號為對應的所述區間標識;
和/或,
所述為每一個所述樣本特征向量生成對應的近鄰圖索引,包括:
針對每一個所述樣本特征向量,執行:
為所述樣本特征向量查找至少一個近鄰樣本特征向量;
從所述樣本特征向量開始,向每一個所述近鄰樣本特征向量繪制對應的有向邊,形成所述樣本特征向量的近鄰圖索引;
和/或,
進一步包括:構建數據空間;
所述將每一個所述樣本特征向量映射到所述映射向量,根據映射的結果,將每一個所述樣本標識分配給相關的所述區間標識,包括:
將每一個所述樣本數據元對應的樣本特征向量和至少一個映射向量加載到所述數據空間;
將每一個所述樣本特征向量抽象為所述數據空間中的一個數據點,并將每一個所述映射向量抽象為所述數據空間中的一條有向線段;
針對每一個所述樣本特征向量對應的數據點,執行:
將所述樣本特征向量對應的數據點投影到每一個所述映射向量對應的有向線段上,并確定所述數據點在每一個所述映射向量對應的有向線段的投影位置;
將所述樣本特征向量對應的所述樣本標識分配給所述投影位置所屬區間。
3.根據權利要求1所述的方法,其特征在于,所述將每一個所述樣本特征向量映射到所述映射向量,根據映射的結果,將每一個所述樣本標識分配給相關的所述區間標識,包括:
基于所述映射向量,計算每一個所述樣本特征向量的哈希值;
針對每一個所述樣本標識,執行:
當所述樣本標識對應的所述樣本特征向量的哈希值與當前區間標識一致時,將所述樣本標識分配給所述當前區間標識。
4.根據權利要求3所述的方法,其特征在于,所述基于所述映射向量,計算每一個所述樣本特征向量的哈希值,包括:
根據下述第一計算公式,計算每一個所述樣本特征向量的哈希值;
第一計算公式:
其中,h(x)表征哈希值;a表征所述映射向量;x表征樣本特征向量;w表征所述預設的區間寬度;b表征預設的偏移量且b∈[0,w)。
5.一種數據檢索方法,其特征在于,利用權利要求1至4任一所述的方法為至少兩個樣本數據元生成至少一個近鄰圖索引和至少一個倒排文檔索引,還包括:
當接收到檢索信息時,提取所述檢索信息包含的檢索特征向量;
針對每一個所述倒排文檔索引,執行:
基于所述倒排文檔索引,計算所述檢索特征向量對應的哈希值;
利用所述檢索特征向量對應的哈希值、所述倒排文檔索引以及所述至少一個近鄰圖索引進行檢索。
6.根據權利要求5所述的方法,其特征在于,所述基于所述倒排文檔索引,計算所述檢索特征向量對應的哈希值,包括:
根據下述第二計算公式,計算所述檢索特征向量對應的哈希值;
第二計算公式:
其中,f(y)表征所述檢索特征向量對應的哈希值;βi表征倒排文檔索引i對應的映射向量;y表征所述檢索特征向量;w表征所述倒排文檔索引對應的區間寬度;δ表征為所述檢索特征向量預設的偏移量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611170581.9/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





