[發(fā)明專利]一種基于深度學習的圖像哈希編碼方法有效
| 申請?zhí)枺?/td> | 201710182659.7 | 申請日: | 2017-03-24 |
| 公開(公告)號: | CN107016708B | 公開(公告)日: | 2020-06-05 |
| 發(fā)明(設計)人: | 顏成鋼;楊東寶;孫垚棋;彭冬亮;張勇東;薛安克 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 杜軍 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 圖像 編碼 方法 | ||
本發(fā)明公開了一種基于深度學習的圖像哈希編碼方法。本發(fā)明包括如下步驟:步驟1、采用在ImageNet圖像識別數(shù)據(jù)庫上訓練好的圖像分類模型GoogLeNet作為初始化的基本網(wǎng)絡結構,并將GoogLeNet模型的最后一層分類層替換為哈希層,該哈希層的單元數(shù)即為圖像要編碼成的比特數(shù);步驟2、對GoogLeNet模型的參數(shù)進行優(yōu)化;步驟3、將圖像檢索數(shù)據(jù)集中的圖像輸入至優(yōu)化好的GoogLeNet模型,并將GoogLeNet模型輸出的浮點數(shù)量化為二值碼,從而得到每幅圖像的二值碼。本發(fā)明實現(xiàn)了圖像特征與哈希函數(shù)的聯(lián)合優(yōu)化,克服了傳統(tǒng)哈希方法學習到的哈希編碼與圖像特征不符的缺點。
技術領域
本發(fā)明涉及一種編碼方法,尤其涉及一種基于深度學習的圖像哈希編碼方法。
背景技術
隨著網(wǎng)絡上的圖像數(shù)量迅速增長,基于內(nèi)容的圖像檢索日趨重要,哈希技術得到了越來越多的關注。哈希技術的目標是構建哈希函數(shù),將數(shù)據(jù)從原始空間映射到壓縮的二進制碼,同時保留原始空間的數(shù)據(jù)結構。由于壓縮的二進制碼能提高計算和存儲的效率,所以哈希對于最近鄰查找來說是一項強有力的技術。大部分的哈希編碼方法的流程是:首先提取圖像的手工設計的特征表示,然后在此基礎上學習哈希函數(shù)。手工設計的特征更傾向于描述圖像的視覺信息,而不是其語義信息,此外特征的學習和哈希函數(shù)的學習兩個階段割裂,會導致產(chǎn)生的二值碼與特征表示不符。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術的不足,提供一種基于深度學習的圖像哈希編碼方法。
本發(fā)明解決其技術問題所采用的技術方案包括如下步驟:
步驟1、采用在ImageNet圖像識別數(shù)據(jù)庫上訓練好的圖像分類模型GoogLeNet作為初始化的基本網(wǎng)絡結構,并將GoogLeNet模型的最后一層分類層替換為哈希層,該哈希層的單元數(shù)即為圖像要編碼成的比特數(shù);
步驟2、對GoogLeNet模型的參數(shù)進行優(yōu)化;
2-1.每次迭代將從圖像檢索數(shù)據(jù)集中選取的50幅圖像,作為GoogLeNet模型的輸入;并且將圖像上人工標注的標簽信息同時作為GoogLeNet模型的輸入,用于判斷圖像間的相似性;共迭代M次;
2-2.在每次迭代中,將從圖像檢索數(shù)據(jù)集中選取的50幅圖像隨機兩兩組合構成成對圖像,并通過成對圖像的標簽信息判斷兩幅圖像是否相似,從而對成對圖像進行損失計算;
2-3.根據(jù)每幅圖像輸入進GoogLeNet模型得到的二值碼,進行二值碼均勻分布損失的計算和量化損失的計算;
2-4.計算出每一次迭代的圖像的所有損失,即成對圖像損失、二值碼均勻分布損失和量化損失的累加;然后使用隨機梯度下降算法和反向傳播算法來對GoogLeNet模型的參數(shù)進行更新,迭代進行M次后,得到了優(yōu)化好的GoogLeNet模型;
步驟3、將圖像檢索數(shù)據(jù)集中的圖像輸入至優(yōu)化好的GoogLeNet模型,并將GoogLeNet模型輸出的浮點數(shù)量化為二值碼,從而得到每幅圖像的二值碼。
所述的成對圖像的損失通過如下?lián)p失函數(shù)計算:
s.t.bi∈{-1,+1}q,i∈{1,2}, (1)
其中,設輸入的成對圖像分別為I1,I2,其對應的二值碼為b1,b2;S表示兩幅圖像是否相似,若相似,S=1;否則,S=0;H(·,·)表示兩個二值碼間的海明距離,如果兩幅圖像是相似圖像,則損失等于其二值碼間的海明距離,否則當兩幅圖像不相似時,定義一個閾值t,若海明距離小于該閾值時,才對該損失函數(shù)有貢獻;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經(jīng)杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710182659.7/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





