[發明專利]一種雙重補償的多表哈希圖像檢索方法有效
| 申請號: | 201710088703.8 | 申請日: | 2017-02-20 |
| 公開(公告)號: | CN106777388B | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 吳永賢;周先成;田星 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/583;G06F16/532 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 羅觀祥 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 雙重 補償 多表哈 希圖 檢索 方法 | ||
本發明公開了一種雙重補償的多表哈希圖像檢索方法,包括步驟:1)圖像特征提取和類別信息處理;2)哈希表訓練;3)根據哈希表將圖像特征映射至漢明空間與類別權重計算;4)根據查詢,計算漢明距離,返回查詢結果;5)再排序操作。本發明方法在圖像檢索方面能夠獲得查詢響應快,內存開銷小,查詢性能高的特點,并在多表哈希的圖像檢索方面有較大的改進,并克服了多表哈希需要額外開銷的缺點。
技術領域
本發明涉及圖像檢索的技術領域,尤其是指一種雙重補償的多表哈希圖像檢索方法。
背景技術
隨著互聯網的發展,多媒體文件數量迅速增長,人們上傳的圖像也成了一個非常大的規模。這對圖像檢索問題有了非常大的挑戰。傳統的基于樹形結構的檢索方法,一般都需要許多額外的輔助空間,這甚至超過原始的圖像數據的大小;而且一旦圖像的特征維數很大的時候,基于樹形結構的方法性能將會退化,甚至到了線性檢索的復雜度。相反,基于哈希的圖像檢索方法始終擁有超線性的時間復雜度,而且需要的輔助空間也十分令人滿意。
對于擁有F個哈希位的基于哈希的圖像檢索方法,首先將圖像映射至低維的漢明空間。對于每一個圖像都使用F個哈希位代表,并使用這些二進制位的漢明距離來衡量圖像之間的相似度。對于一個良好的方法而言應該保證相似的圖像擁有小的漢明距離,不相似的圖像擁有大的漢明距離。本方法的查詢過程如下:對于一個查詢圖像,本方法首先將圖像映射至漢明空間,并計算查詢圖像與數據庫中的圖像之間的漢明距離,返回漢明距離較小的圖像作為查詢結果(由使用者設置的閾值決定)。由于哈希位可以用二進制位表示,漢明距離可以使用機器內置的位操作計算,因此基于哈希的圖像檢索方法可以使用較少的輔助內存,達到較快的檢索速度,至于檢索的準確度,則由方法的設計者保證了。
在基于哈希的圖像檢索領域,按照是否使用語義標簽而言,可以分為有監督哈希,半監督哈希,無監督哈希三類。有監督哈希方法利用標簽信息來訓練哈希函數,要求數據庫提供完整的標簽信息;半監督哈希也利用了數據庫中的標簽信息,但容忍部分數據是無標簽的;無監督哈希指的是那些不利用標簽信息的哈希方法。圖像數據庫中的圖像往往都擁有一些語義標簽,這些信息可以很好的提升性能,無監督哈希方法忽略這些信息很可能損失檢索性能,有監督哈希方法要求所有的圖像都有語義標簽,這也是不符合現實的,本方法是一種半監督哈希圖像檢索方法,能夠很好的利用標簽信息同時也更符合實際情況。
發明內容
本發明的目的在于克服現有哈希圖像檢索方法在多表檢索上的不足,提出了一種雙重補償的多表哈希圖像檢索方法,該方法主要是體現了較為良好的性能,并且能夠解決多表哈希在同等性能下需要更多開銷的缺點。
為實現上述目的,本發明所提供的技術方案為:一種雙重補償的多表哈希圖像檢索方法,包括以下步驟:
1)圖像特征提取和類別信息處理;
2)哈希表訓練;
3)根據哈希表將圖像特征映射至漢明空間與類別權重計算;
4)根據查詢,計算漢明距離,返回查詢結果;
5)再排序操作。
在步驟1)中,提取圖像特征,并進行標簽信息的處理,具體步驟如下:
1.1)使用gist算法提取圖像特征,獲取圖像特征矩陣X,X=d×n,n為數據集圖片數量,d為特征維數,對X矩陣進行中心化操作;
1.2)將圖像分成兩個子集:有語義標簽的數據劃分成有標簽的圖像子集,其特征矩陣為Xl,無語義標簽的數據劃分成無標簽的圖像子集,其特征矩陣為Xu;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710088703.8/2.html,轉載請聲明來源鉆瓜專利網。





