[發明專利]一種基于序列保留哈希的超低復雜度圖像檢索方法有效
申請號: | 201611127943.6 | 申請日: | 2016-12-09 |
公開(公告)號: | CN106777038B | 公開(公告)日: | 2019-06-14 |
發明(設計)人: | 紀榮嶸;林賢明;劉弘 | 申請(專利權)人: | 廈門大學 |
主分類號: | G06F16/583 | 分類號: | G06F16/583;G06K9/46;G06K9/62 |
代理公司: | 廈門南強之路專利事務所(普通合伙) 35200 | 代理人: | 馬應森 |
地址: | 361005 *** | 國省代碼: | 福建;35 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 基于 序列 保留 復雜度 圖像 檢索 方法 | ||
1.一種基于序列保留哈希的超低復雜度圖像檢索方法,其特征在于包括以下步驟:
1)對于圖像庫中的圖像,隨機選取一部分圖像作為訓練集,并抽取相應的圖像特征,所述圖像特征包括但不限于GIST特征;
2)采用非線性主成分分析方法,將原圖像特征降低維度到與哈希編碼相同的長度;
3)利用K-means聚類算法得到一系列的支撐點,作為后續哈希函數學習的基礎;
4)通過迭代優化學習對應的哈希函數,具體方法如下:
(4.1)選擇一個query特征,計算該特征與所有支撐點之間的關系,同時構建序列關系圖;
(4.2)在序列關系圖中,以query最近鄰的支撐點為基準,挑選一部分序列關系子集;
(4.3)利用隨機梯度下降算法計算最優哈希函數;
(4.4)置信度判斷,滿足條件跳出迭代,否則繼續循環;
5)輸出對應的哈希函數,并計算整個圖像庫的哈希編碼;
6)對于查詢圖像,首先抽取對應的GIST特征,然后根據訓練得到的哈希編碼函數用同樣的方法對圖像特征進行哈希編碼,之后計算查詢圖像的哈希編碼與圖像庫中的圖像特征編碼之間的漢明距離,利用漢明距離大小來衡量查詢圖像與圖像庫中待檢索圖像之間的相似性,返回相似度高的圖像;
所述序列保留哈希的算法,目標在于獲取哈希函數,即:
H(x)={h1(x),h2(x),...,hr(x)}
哈希函數將原實數特征矩陣映射為相對應的二值編碼矩陣B={b1,b2,...,bn}∈{0,1}r×n,其中,r為哈希編碼的長度,其形式化描述如下所示:
首先,查詢圖像和待檢索圖像庫的圖像GIST特征抽取的形式化描述為:對于訓練集中的每幅圖像提取d維的GIST特征,得到一個d×n的原始視覺特征矩陣X={x1,x2,...,xn}∈Rd×n,其中,n表示訓練集中的訓練樣本個數,xi為矩陣X第i列表示樣本集合中第i個維度為d的GIST特征向量;
其次,使用非線性主成分分析技術,即核化主成分分解,將圖像的特征降維到與哈希編碼比特長度相同的低維度空間表示,具體步驟如下:
(1)對原特征做核特征變換,在樣本集中隨機選取m個數據點作為錨點,即A={a1,...,am}∈Rd×m;
(2)采用高斯核變換方法對原特征進行重新描述,原特征xi對應的高斯核特征ki中第j維表示為kij=exp(-||xi-aj||2/2σ2);
(3)對新的核變換特征做主成分分析,求出從高維核特征空間到低維度的線性投影矩陣Z∈Rm×r,其優化函數為:通過非線性主成分分析后,原高維特征矩陣重新表示為
在新的低維度特征表達空間中,目標是求解一個序列嵌入的哈希函數,定義為其中,sgn(·)為符號函數,用以將實數值量化為對應的哈希編碼,通過雙曲正切函數來逼近這個符號函數;
整個學習算法過程需要保證原空間中特征之間的序列關系在新的漢明空間中有近似等同的關系,因此目標函數表示為:
其中,α和β是模型參數為1;為對樣本集進行k-means聚類得到的聚類中心特征的非線性主成分表達,bli為其對應的哈希編碼;o(m,j,k)為序列關系函數,定義為D(m,j)為樣本xm和xj之間的歐式距離;max[0,x]為最大值函數,定義為通過隨機梯度下降的優化方法,求出最優的投影矩陣W,進而得到所需要的哈希函數;
對于,查詢圖像特征和待檢索的圖像庫特征,采用如下哈希函數進行相應哈希編碼:
H(x)=sgn(WTZTx)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611127943.6/1.html,轉載請聲明來源鉆瓜專利網。