[發明專利]一種可變長度哈希編碼的高維數據最近鄰查詢方法有效
| 申請號: | 201811298578.4 | 申請日: | 2018-11-02 |
| 公開(公告)號: | CN109684518B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 任艷多;錢江波;孫瑤;胡偉 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/9032 |
| 代理公司: | 寧波奧圣專利代理有限公司 33226 | 代理人: | 程天鵬 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 可變 長度 編碼 數據 近鄰 查詢 方法 | ||
1.一種可變長度哈希編碼的高維數據最近鄰查詢方法,其特征在于包括以下步驟:
①獲取包含多個原始高維數據的原始高維數據集并給定查詢點,對原始高維數據集做低維映射,生成由與每個原始高維數據對應的隨機傅里葉特征向量組成的隨機傅里葉特征向量集;
②根據每個隨機傅里葉特征向量的哈希值進行編碼獲得與每個原始高維數據對應的哈希碼,對所有哈希碼中每個哈希碼出現的次數進行統計得到用于表示每個哈希碼出現頻率的編碼頻率,將編碼頻率相同的哈希碼作為一組子數據集得到多組子數據集,并按編碼頻率從高到低的順序對所有子數據集進行排列得到每個子數據集的排序序號,對每組子數據集設置一個與該組子數據集的編碼頻率互為倒數的壓縮比,根據壓縮比對每組子數據集進行壓縮,得到壓縮后的子數據集及壓縮后的子數據集的編碼長度,然后按照壓縮損失及量化損失之和最小的方法對壓縮后的子數據集進行訓練,得到訓練后的子數據集及訓練后的子數據集的哈希編碼;
③將每組訓練后的子數據集通過提取隨機傅里葉特征得到與每組訓練后的子數據集對應的原始編碼,根據原始編碼的編碼長度和原始編碼對應的壓縮比復制每組訓練后的子數據集的哈希編碼,得到每組訓練后的子數據集的哈希編碼的多個復本;
④將每組訓練后的子數據集的原始編碼和每組訓練后的子數據集的哈希編碼的復本串聯得到與每組訓練后的子數據集對應的串聯后的哈希編碼,將所有訓練后的子數據集對應的串聯后的哈希編碼融合組成最終的最近鄰查詢表;
⑤對給定的查詢點提取隨機傅里葉特征向量,將給定的查詢點的隨機傅里葉特征向量映射到與訓練后的子數據集對應的串聯后的哈希編碼的編碼長度一致的隨機傅里葉編碼,將該隨機傅里葉編碼作為查詢點對應的查詢編碼,最后在最終的最近鄰查詢表中查找與查詢點對應的查詢編碼海明距離最近的最近鄰數據集,將該最近鄰數據集作為給定的查詢點的最近鄰查詢結果,完成對給定的查詢點的最近鄰查詢過程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811298578.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





