[發(fā)明專利]一種基于局部相似哈希算法的大規(guī)模圖像庫檢索方法有效
| 申請?zhí)枺?/td> | 201410440566.6 | 申請日: | 2014-09-01 |
| 公開(公告)號: | CN104199922B | 公開(公告)日: | 2019-05-03 |
| 發(fā)明(設(shè)計)人: | 張樹武;張桂煊;郭勤振;曾智 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 局部 相似 算法 大規(guī)模 圖像 檢索 方法 | ||
一種基于局部相似哈希算法的大規(guī)模圖像庫檢索方法,包括:從待檢索圖像庫中選取部分圖像作為訓(xùn)練圖像集,提取訓(xùn)練集圖像的SIFT特征;利用K均值算法對訓(xùn)練集的SIFT特征進行聚類,得到碼本;在訓(xùn)練集上計算碼本中每一碼字的逆頻率;對每一碼字進行局部敏感哈希編碼;對查詢圖像和待檢索圖像庫中圖像分別提取SIFT特征;針對某一幅圖像計算其中每一碼字的詞頻,進而得到每一碼字的權(quán)重;利用相似哈希算法計算圖像的局部相似哈希編碼;計算查詢圖像的哈希編碼與待檢索圖像的哈希編碼之間的漢明距離;利用漢明距離來快速檢索與查詢圖像相似的圖像。本發(fā)明的方法具有很好的普適性,既減少了數(shù)據(jù)的存儲空間又提高了查詢的檢索效率。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像檢索技術(shù)領(lǐng)域,更具體地涉及一種基于內(nèi)容的圖像檢索方法,尤其是一種基于局部相似哈希算法的大規(guī)模圖像庫檢索方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)上的圖片數(shù)據(jù)日益增多。如何快速、準確地為用戶提供所需要的圖片資源顯得越來越重要。基于內(nèi)容的圖像檢索(content-based imageretrieval,CBIR)技術(shù)應(yīng)運而生,受到了許多研究者的關(guān)注。一般來說CBIR系統(tǒng)主要包括兩部分的核心研究內(nèi)容,一是有效的圖像特征表述,二是高效檢索算法。
圖像特征表述方面,最初的CBIR系統(tǒng)利用圖像的全局底層特征,例如顏色、紋理、形狀等來表述圖像。但是這類全局特征不能很好地捕捉到圖像的局部信息,因此判別性不高。基于SIFT(Scale Invariant Feature Transform,尺度不變特征轉(zhuǎn)換,具體含義例如參見文章David G.Lowe,“Distinctive image features from scale invariantkeypoints”,International Journal ofComputer Vision,66(2),2004)局部特征的詞袋模型(BOW) (相關(guān)內(nèi)容例如參見文章Josef Sivic and Andrew Zisserman,“Videogoogle: A text retrieval approach to object matching in videos”,InProceedings of International Conference on Computer Vision,2003),是一種新穎的圖像表述方法。在BOW中,首先提取圖像的局部SIFT特征,然后將SIFT特征量化成碼本(codebook),最后利用碼本的信息來表示圖像。
檢索算法方面主要包括基于樹的檢索算法和基于哈希的檢索算法。基于樹的檢索算法利用超平面遞歸地劃分整個數(shù)據(jù)空間,在數(shù)據(jù)比較低維的情況下效果很好,但是當數(shù)據(jù)維度比較高的時候,基于樹的檢索算法會退化成窮盡搜索。基于哈希的檢索算法的主要思想是將原始數(shù)據(jù)映射成漢明空間中的二進制數(shù)值串(binary string),數(shù)據(jù)之間的相似度可以利用它們在漢明空間的二進制數(shù)值串之間的漢明距離來度量。基于哈希的高效檢索算法有兩個主要優(yōu)點:一是可以減少數(shù)據(jù)存儲空間;二是可以提高檢索效率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410440566.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





