[發明專利]一種基于集成哈希編碼的快速圖像檢索方法無效
| 申請號: | 201410657380.6 | 申請日: | 2014-11-19 |
| 公開(公告)號: | CN104298791A | 公開(公告)日: | 2015-01-21 |
| 發明(設計)人: | 李鵬;呂新榮;宋華軍;任鵬 | 申請(專利權)人: | 中國石油大學(華東) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/46;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 集成 編碼 快速 圖像 檢索 方法 | ||
?
技術領域
本發明涉及基于內容的圖像檢索方法,特別涉及一種基于集成哈希編碼的快速圖像檢索方法,屬于數字圖像檢索技術領域。
背景技術
隨著多媒體網絡技術的發展,互聯網上的圖像資源呈爆炸式增長,使得用戶很難在浩如煙海的數據中找到真正感興趣的信息。因此,如何對海量的圖像進行快速有效的分析和檢索成了一個非常具有挑戰性的任務。傳統的基于內容的圖像檢索技術往往都是通過提取圖像的底層特征進行窮舉比對,但因其比較過程的時間復雜度是線性的,無法在大規模網絡圖像數據上進行擴展和應用,并且由于圖像的底層視覺特征動輒成千上萬維,許多圖像檢索應用還會遇到維數災難的問題,如何對如此龐大的原始數據進行存儲也是一個巨大瓶頸。
過去的十年中,研究者們對圖像的快速檢索技術進行了詳細研究。其中,基于哈希編碼的圖像搜索方法取得了巨大成功。該類算法通過將圖像表示成低維的二進制編碼向量來完成近似近鄰搜索。利用二進制編碼進行圖像的近似近鄰搜索是極其快速的,因為:1)圖像的編碼向量是高度壓縮的,可以將其全部載入內存之中;2)編碼之間的漢明(Hamming)距離通過按位的異或操作便可得到,因此該計算過程是非常高效的(如今,一臺普通的臺式機在幾毫秒之內就可以完成數百萬漢明距離的計算)。
目前,傳統的圖像哈希編碼算法主要分為非數據依賴和數據依賴兩種方案。其中一種非常著名的非數據依賴哈希算法便是局部敏感哈希(Locality?Sensitive?Hashing,?LSH)?,但是其投影向量的隨機性導致其編碼效率并不高,它往往需要構建具有很長編碼長度的多個哈希表才能獲得較為理想的效果。近年來,研究者們將研究重點轉移到數據依賴的哈希算法上來,試圖通過機器學習的方法代替隨機投影來尋找更好的數據依賴哈希函數,如基于深度學習網絡的限制玻爾茲曼機(Restricted?Boltzmann?Machines,?RBMs)?和基于譜圖分割的譜哈希(Spectral?Hashing,?SH)算法等。RBMs算法通過神經網絡模型逐層對圖像的原始特征進行降維和學習,并最終得到一個緊致的二進制編碼。SH算法則通過構建拉普拉斯特征圖并利用主成分分析(PCA)方法提取其特征向量對原始圖像進行哈希編碼。但是上述方法都是基于單一的圖像底層視覺特征信息進行哈希編碼,無法全面地表達圖像豐富的內容信息。后續的研究,如多特征哈希算法(Multiple?Feature?Hashing,?MFH)和多源信息合成哈希算法(Composite?Hashing?with?Multiple?Information?Sources,?CHMIS)等,又在多種特征信息的融合等方面對數據依賴哈希算法進行了相關的拓展。雖然上述哈希算法是針對問題的不同角度提出,都具有各自的一些特點和優越性,但它們往往只在某些特定的設置條件或者數據庫上有效,范圍擴展性較差。此外,鑒于網絡圖像數據特征的多樣性和結構的復雜性,目前傳統的基于單一哈希編碼的圖像檢索方法已無法滿足實際應用中對于快速圖像檢索的準確率的需求。
發明內容
本發明的目的在于克服現有技術的不足,提出一種基于集成哈希編碼的快速圖像檢索方法。本發明的特點在于能夠充分利用不同哈希算法的特點,融合不同哈希算法的編碼優勢,通過一致性約束準則更有效地進行集成哈希編碼的學習,從而提高快速圖像檢索方法的準確率和普適性。
本發明的技術方案是:對數據庫中的訓練圖像和查詢圖像分別提取其SIFT特征并利用K-均值聚類將其量化表示成特征向量的形式,利用不同的圖像哈希編碼算法對訓練圖像的特征向量進行初始哈希編碼,然后在不同算法得到的初始哈希編碼基礎上分別計算訓練圖像之間的相似度矩陣,并通過集成學習算法的一致性約束準則學習得到新的集成哈希映射矩陣,最后利用集成哈希映射矩陣對所有訓練圖像和查詢圖像的特征向量重新進行集成哈希編碼,并在集成哈希編碼的基礎上通過計算查詢圖像與訓練圖像之間的漢明距離來進行快速檢索。其具體步驟如下:
(1)給定數據庫,將其分為訓練圖像數據庫和查詢圖像數據庫,對每一幅訓練圖像和查詢圖像分別提取SIFT特征并利用K-均值聚類將其量化表示為d維的特征向量,其中n和q分別為訓練圖像和查詢圖像的數量,則所有訓練圖像的特征向量可以組成一個訓練圖像特征向量庫,其中X為維的矩陣,X的每一行分別為相應訓練圖像的特征向量,所有查詢圖像的特征向量可以組成一個查詢圖像特征向量庫,其中Y為維的矩陣,Y的每一行分別為相應查詢圖像的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油大學(華東),未經中國石油大學(華東)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410657380.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種抗靜電改性的塑料原料的制造方法
- 下一篇:一種耐磨塑膠材料





