[發明專利]一種基于高階深度哈希學習的圖像檢索方法有效
| 申請號: | 201810919209.6 | 申請日: | 2018-08-14 |
| 公開(公告)號: | CN109241313B | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 張建新;吳悅;張強 | 申請(專利權)人: | 大連大學 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06F16/51;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 大連八方知識產權代理有限公司 21226 | 代理人: | 衛茂才 |
| 地址: | 116622 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 圖像 檢索 方法 | ||
1.一種基于高階深度哈希學習的圖像檢索方法,其特征在于,該方法包括以下步驟:
步驟S1:構造包含圖像數據及標簽的圖像數據集,并劃分為訓練集、測試集和檢索圖像集三部分,訓練集用于模型訓練,測試集和檢索圖像集用于模型測試;
步驟S2:高階深度哈希網絡由基礎特征子網絡、高階池化子網絡、哈希子網絡及損失子網絡依次銜接構成,其中:
S21:基礎特征子網絡使用VGG-F網絡的1-14層構建;
S22:高階池化子網絡設計為協方差池化層,其將基礎特征子網絡輸出的深度特征轉化為樣本協方差矩陣,然后基于特征值分解和矩陣冪獲得高階深度特征;
S23:哈希子網絡由哈希隱層和激活層構建,哈希隱層將高階特征線性映射到指定編碼位的全連接層,配合激活層將數值變化至[0,1]范圍;
S24:損失子網絡由全連接層和Softmax交叉熵損失層組成,僅用于指導網絡訓練;
步驟S3:高階深度哈希網絡模型的端對端訓練,包括模型特征前向傳播和誤差反向傳播兩個過程;
步驟S4:根據學習到的高階深度哈希網絡,計算測試集和檢索圖像集的深度高階哈希碼;
步驟S5:計算測試集與檢索圖像集哈希碼之間的漢明距離,將最小漢明距離對應的圖像作為檢索結果輸出,用平均精度均值指標評判該方法整體性能。
2.根據權利要求1所述的基于高階深度哈希學習的圖像檢索方法,其特征在于,步驟S3中模型特征前向傳播利用訓練集作為網絡輸入,經過基礎特征子網絡、高階池化子網絡,獲得高階深度特征,該特征由哈希子網絡映射為[0,1]范圍的可編碼特征,具體計算公式如下:
H=WHT[UF(Λ)UT]+σ
其中,H=[h1,h2,...hN],WHT∈R4096×K表示哈希層的權重,K代表哈希碼比特位數,σ∈RK代表K維偏置向量,U和Λ分別代表前向過程產生的協方差矩陣通過特征值分解得到的正交陣和對角陣。
3.根據權利要求1所述的基于高階深度哈希學習的圖像檢索方法,其特征在于,步驟S3中的誤差反向傳播利用交叉熵損失函數作為目標函數,衡量哈希碼預測值和圖像真實標簽之間的差別,誤差值計算公式如下:
其中,M代表數據集的標簽數目,N是圖片個數,xi代表第i張圖片經過全連接層的輸出,yi代表第i張圖像的真實標簽,代表可編碼特征經Softmax操作映射為各標簽的預測概率,在反向傳播中采用隨機梯度下降法,利用鏈式法則對各參數逐層求偏導,確定反向傳播誤差,不斷更新網絡模型的參數,優化高階深度哈希網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連大學,未經大連大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810919209.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:旋律的填詞方法、裝置及終端設備
- 下一篇:一種基于深度學習的快速人臉檢索方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





