[發(fā)明專利]一種基于局部相似哈希算法的大規(guī)模圖像庫檢索方法有效
| 申請?zhí)枺?/td> | 201410440566.6 | 申請日: | 2014-09-01 |
| 公開(公告)號: | CN104199922B | 公開(公告)日: | 2019-05-03 |
| 發(fā)明(設計)人: | 張樹武;張桂煊;郭勤振;曾智 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 局部 相似 算法 大規(guī)模 圖像 檢索 方法 | ||
1.一種基于局部相似哈希算法的大規(guī)模圖像庫檢索方法,包括下列步驟:
提取查詢圖像和待檢索圖像庫中訓練集圖像的特征,具體包括以下步驟:
對所述待檢索圖像庫中訓練集的圖像提取SIFT特征;
對提取的所述SIFT特征進行K均值聚類得到碼本;
計算碼本中每一碼字的逆頻率;
計算每一碼字的局部敏感哈希編碼;
將所述SIFT特征映射到漢明空間;
利用碼本中每一碼字的逆頻率計算每一碼字的權重,并利用所述每一碼字的權重和所述每一碼字的局部敏感哈希編碼計算所述查詢圖像的局部相似哈希編碼和所述待檢索圖像庫中每一幅圖像的局部相似哈希編碼;計算所述查詢圖像的局部相似哈希編碼與所述待檢索圖像庫中每一幅圖像的局部相似哈希編碼之間的漢明距離,利用距離大小來衡量所述查詢圖像與所述待檢索圖像庫中圖像之間的相似性,返回相似度高的圖像。
2.一種基于局部相似哈希算法的大規(guī)模圖像庫檢索方法,包括下列步驟:
步驟S1,對待檢索圖像庫中選作為訓練集的全部圖像提取SIFT特征,對其進行K均值聚類得到碼本,再計算每一碼字的逆頻率;
步驟S2,利用步驟S1得到的所述碼本計算待檢索圖像庫中每一幅圖像的局部相似哈希編碼;
步驟S3,利用步驟S1得到的所述碼本計算查詢圖像的局部相似哈希編碼,并由此計算所述查詢圖像的局部相似哈希編碼與所述待檢索圖像庫中每一幅圖像的局部相似哈希編碼之間的漢明距離,返回所述待檢索圖像庫中與所述查詢圖像漢明距離最小的S個圖像作為檢索結果,其中S為由用戶預先設定的正整數(shù)。
3.根據(jù)權利要求2所述的基于局部相似哈希算法的大規(guī)模圖像庫檢索方法,其中所述步驟S1進一步包括以下步驟:
步驟S11:從待檢索圖像庫D={D1,D2,...,DN}中選取部分圖像T={T1,T2,...Tn}作為訓練集,其中N為待檢索圖像庫的大小,n為訓練集的大小,n≤N;
步驟S12:對所述訓練集T中的全部圖像分別提取SIFT特征,構成SIFT特征集合V={Vi},1≤i≤z,z為訓練集圖像中提取的SIFT特征總數(shù);
步驟S13:對提取的所述SIFT特征進行K均值聚類,得到碼本C={ci},其中1≤i≤q,q為碼本的大小,即碼字的個數(shù);為d維的列向量;
步驟S14:通過下式計算每一碼字ci的逆頻率IDFi:
其中1≤i≤q,n為訓練集的大小,ni為包含碼字ci的圖像的數(shù)量,lg表示以10為底計算對數(shù)值;
步驟S15:計算每一碼字ci的局部敏感哈希編碼Li,其中Li∈{-1,1}k,k是總的編碼位數(shù)。
4.根據(jù)權利要求3所述的方法,其中步驟S13中所述的K均值聚類步驟進一步包括以下步驟:
步驟131:從V中隨機選取q個SIFT特征作為初始聚類中心μi,1≤i≤q;
步驟132:將訓練集中提取的SIFT特征按照歐氏距離最近的準則分配給q個聚類中心的某一個μi,這樣所有的SIFT特征形成q個簇;計算每個簇中所有SIFT特征的均值,并將該均值作為該簇新的聚類中心μi;計算每個簇中的誤差平方和,進而得到q個簇總的誤差平方和;
步驟133:重復步驟132,直到總的誤差平方和小于給定閾值時,K均值算法結束,并將得到的q個簇的聚類中心μi作為碼本C。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經(jīng)中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410440566.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





