[發明專利]一種面向高維大數據集的加權量化哈希檢索方法有效
| 申請號: | 201811316883.1 | 申請日: | 2018-11-07 |
| 公開(公告)號: | CN109634953B | 公開(公告)日: | 2021-08-17 |
| 發明(設計)人: | 孫瑤;錢江波;胡偉;任艷多 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2458;G06K9/62 |
| 代理公司: | 寧波奧圣專利代理有限公司 33226 | 代理人: | 程天鵬 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 高維大 數據 加權 量化 檢索 方法 | ||
1.一種面向高維大數據集的加權量化哈希檢索方法,其特征在于包括以下步驟:
步驟①:獲取由n個原始高維數據組成的原始高維數據集X并給定查詢數據q,X為n×d維的矩陣,q為1×d維的向量,使用主成份分析算法對X進行降維,得到與X對應的低維向量集V,其中,V為n×c維的矩陣,c<d,vij表示原始高維數據中第i個數據第j維度在V中對應的低維向量元素,1≤i≤n,1≤j≤c,再使用主成份分析算法對q進行降維,得到與q對應的1×c維的低維向量q′;
步驟②:通過迭代獲取最終二進制編碼矩陣B″和最終權重矩陣W″,具體過程如下:
步驟②-1:設定最大迭代次數,隨機給定初始二進制編碼矩陣B,B∈{-1,1}n×c,隨機給定初始權重矩陣W,W=diag(w1,w2,...,wj,...,wc),其中,wj表示第j維度的維度權重,diag()表示對角矩陣;
步驟②-2:根據哈希函數構造原理中的成對保相似性原則構造損失函數,再引入完全正交約束條件,將完全正交約束條件進行松弛化操作,從而構造出損失函數其中,|| ||F為取矩陣的F-范數符號,中的2為平方符號,BT表示B的轉置矩陣,I表示單位矩陣;
步驟②-3:開始迭代過程,在當前一次迭代過程中,首先保持W不變,對進行最小化求解,利用梯度下降法對B進行更新,將最小時更新得到的B記為B′,bij表示X中第i個原始高維數據第j維度的元素在當前一次迭代過程中對應的更新后的二進制編碼值;
再保持B′不變,通過對進行最小化求解對W進行更新,將最小時更新得到的W記為W′;
步驟②-4:判斷當前迭代過程的迭代次數是否達到設定的最大迭代次數,若未達到最大迭代次數,則令W=W′,B=B′,返回步驟②-3開始下一次迭代過程,同時迭代次數加1,其中W=W′和B=B′中的“=”為賦值符號;若達到最大迭代次數,則將當前一次迭代過程中更新得到的W′作為最終權重矩陣W″,將當前一次迭代過程中更新得到的B′作為最終二進制編碼矩陣B″;
步驟③:根據W″對B″中每個元素進行加權量化,獲得加權后的二進制編碼矩陣Z;
步驟④:根據W″和B″,獲取最小時的q′,作為與q′對應的二進制編碼q″,在Z中查找與q″的加權海明距離最近的行向量數據,將與q″的加權海明距離最近的行向量數據對應的原始高維數據作為最終的最近鄰查詢結果,完成對q的哈希檢索過程。
2.根據權利要求1所述的一種面向高維大數據集的加權量化哈希檢索方法,其特征在于所述的步驟②-1中設定的最大迭代次數為50次。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811316883.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





