[發明專利]一種基于深度學習的圖像哈希編碼方法有效
| 申請號: | 201710182659.7 | 申請日: | 2017-03-24 |
| 公開(公告)號: | CN107016708B | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 顏成鋼;楊東寶;孫垚棋;彭冬亮;張勇東;薛安克 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 杜軍 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 圖像 編碼 方法 | ||
1.一種基于深度學習的圖像哈希編碼方法,其特征在于包括如下步驟:
步驟1、采用在ImageNet圖像識別數據庫上訓練好的圖像分類模型GoogLeNet作為初始化的基本網絡結構,并將GoogLeNet模型的最后一層分類層替換為哈希層,該哈希層的單元數即為圖像要編碼成的比特數;
步驟2、對GoogLeNet模型的參數進行優化;
2-1.每次迭代將從圖像檢索數據集中選取的50幅圖像,作為GoogLeNet模型的輸入;并且將圖像上人工標注的標簽信息同時作為GoogLeNet模型的輸入,用于判斷圖像間的相似性;共迭代M次;
2-2.在每次迭代中,將從圖像檢索數據集中選取的50幅圖像隨機兩兩組合構成成對圖像,并通過成對圖像的標簽信息判斷兩幅圖像是否相似,從而對成對圖像進行損失計算;
2-3.根據每幅圖像輸入進GoogLeNet模型得到的二值碼,進行二值碼均勻分布損失的計算和量化損失的計算;
2-4.計算出每一次迭代的圖像的所有損失,即成對圖像損失、二值碼均勻分布損失和量化損失的累加;然后使用隨機梯度下降算法和反向傳播算法來對GoogLeNet模型的參數進行更新,迭代進行M次后,得到了優化好的GoogLeNet模型;
步驟3、將圖像檢索數據集中的圖像輸入至優化好的GoogLeNet模型,并將GoogLeNet模型輸出的浮點數量化為二值碼,從而得到每幅圖像的二值碼;
步驟2中所述的成對圖像的損失通過如下損失函數計算:
s.t.bi∈{-1,+1}q,i∈{1,2}, (1)
其中,設輸入的成對圖像分別為I1,I2,其對應的二值碼為b1,b2;S表示兩幅圖像是否相似,若相似,S=1;否則,S=0;H(·,·)表示兩個二值碼間的海明距離,如果兩幅圖像是相似圖像,則損失等于其二值碼間的海明距離,否則當兩幅圖像不相似時,定義一個閾值t,若海明距離小于該閾值時,才對該損失函數有貢獻;
由于上式(1)二值碼是離散取值,直接優化困難,因此將整數限制變為范圍限制{-1,+1}-[-1,+1],海明距離變為歐式距離,GoogLeNet模型得到浮點數輸出,公式(1)更新為:
s.t.bi∈[-1,+1]q,i∈{1,2}. (2)
對公式(2)的梯度進行計算如下:
當S=1時,
當S=0時,s.t.bi∈[-1,+1]q,i∈{1,2}, (4)。
2.根據權利要求1所述的一種基于深度學習的圖像哈希編碼方法,其特征在步驟2中所述的二值碼均勻分布損失的計算如下:
將壓縮的二值碼均勻分布,當二值碼中-1和+1出現的概率都為50%時,熵最大信息量最多,所以該均勻分布損失函數定義為:
其中,q表示二值碼的長度,即哈希層的單元數;n為圖像數量,即得到的二值碼數量,bi(j)表示第i個二值碼的第j個比特。
3.根據權利要求2所述的一種基于深度學習的圖像哈希編碼方法,其特征在步驟2所述的二值碼量化的損失通過如下損失函數計算:
由于GoogLeNet模型的哈希層的輸出為浮點數,因此需要通過量化得到二值碼,量化過程如下:
b=sign(v), (6)
其中,v表示GoogLeNet模型的輸出;為了減小從歐式空間到海明空間映射導致的量化誤差,需要一個量化損失函數:用于計算最后一層哈希層的值與量化該哈希層后的值的差,即每個單元量化前與量化后的值相減,具體量化損失函數如下:
其中,如果vi0,則b(i)=1;否則,b(i)=-1,其中,vi表示GoogLeNet模型哈希層輸出的第i個單元的值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710182659.7/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





