[發(fā)明專利]一種基于深度學習的壓縮域大規(guī)模圖像檢索方法有效
| 申請?zhí)枺?/td> | 201910334229.1 | 申請日: | 2019-04-24 |
| 公開(公告)號: | CN110069644B | 公開(公告)日: | 2023-06-06 |
| 發(fā)明(設計)人: | 熊健;任強;熊力瑤;范宇軒;桂冠 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06F16/51;G06N3/0464 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 壓縮 大規(guī)模 圖像 檢索 方法 | ||
1.一種基于深度學習的壓縮域大規(guī)模圖像檢索方法,其特征在于,包括:
S1,利用壓縮CNN網絡對圖像數(shù)據(jù)庫進行壓縮,得到空間占用小于原圖像的壓縮編碼;進一步包括:
a)壓縮前統(tǒng)一圖像尺寸:采用Random-crop方法將圖像尺寸統(tǒng)一到256*256,裁剪后的圖像像素矩陣維度為256*256*3;
b)圖像壓縮:構建基于深度卷積網絡的圖像壓縮網絡,利用ImageNet數(shù)據(jù)集對網絡進行訓練,訓練后的網絡具有較佳的峰值信噪比和結構相似性指標,將圖像檢索數(shù)據(jù)送入訓練后的壓縮網絡的編碼器進行壓縮,得到尺寸為32*32*64的浮點型編碼;
c)壓縮圖片的量化:對圖像壓縮后的浮點數(shù)進行量化;
S2,利用哈希CNN網絡對壓縮圖像進行哈希編碼;所述哈希CNN網絡為改進的AlexNet結構,基于AlexNet結構的改進網絡將壓縮編碼Z轉換成圖像壓縮特征X(i),并利用哈希層將圖像壓縮特征X(i)映射為K維向量,K即為哈希碼的長度;激活函數(shù)使用雙曲正切函數(shù)將K維向量映射到[-1,1]之間,最后將激活函數(shù)的結果進行量化,得到屬于{-1,1}二值空間的二進制哈希碼H;
利用改進的AlexNet結構對壓縮圖像進行哈希編碼的步驟進一步包括:
a)訓練前劃分數(shù)據(jù)集:通過壓縮CNN網絡壓縮后的數(shù)據(jù)集圖像壓縮編碼統(tǒng)一尺寸為32*32*64,將圖像數(shù)據(jù)集以及其對應的標簽分為訓練樣本集和測試樣本集兩部分,其中,訓練樣本集在訓練過程中隨機選取部分圖像作為驗證樣本集;
b)保證訓練模型的魯棒性:對輸入訓練集通過水平翻轉、垂直翻轉進行擴充;
c)構建深度哈希CNN網絡架構:深度卷積神經網絡包含卷積層、全連接層、哈希層、損失層,卷積層用來聚合圖像全局和局部特征,哈希層將聚合之后的圖像特征映射為指定的32Bit到128Bit長度的哈希碼;
d)損失函數(shù)及其優(yōu)化:損失函數(shù)選用基于柯西分布的Cross-entropy損失函數(shù)以及量化損失函數(shù),通過Momentum梯度下降法進行參數(shù)尋優(yōu)以最小化損失函數(shù),使網絡性能最佳;
e)模型應用:在模型應用上,對于輸入圖片,先對其進行鏡像變換、轉置變換、水平翻轉、垂直翻轉,對各自變換后的圖像進行預測,平均預測結果作為最終的預測類別;
S3,在哈希碼數(shù)據(jù)庫中對查詢圖片進行圖像檢索。
2.根據(jù)權利要求1所述的基于深度學習的壓縮域大規(guī)模圖像檢索方法,其特征在于,所述圖像壓縮網絡包含多個殘差塊和池化層和一個量化層,壓縮網絡將圖像壓縮成壓縮編碼。
3.根據(jù)權利要求1所述的基于深度學習的壓縮域大規(guī)模圖像檢索方法,其特征在于,d)中的量化損失函數(shù),用于減少激活層得到的連續(xù)值與所有位為1的哈希碼之間的漢明距離
4.根據(jù)權利要求1所述的基于深度學習的壓縮域大規(guī)模圖像檢索方法,其特征在于,S3進一步包括:
a)深度卷積深度神經網絡模型使用:使用哈希CNN網絡應用于所有壓縮圖像并將得到的哈希碼存于數(shù)據(jù)庫中;
b)哈希查找:使用壓縮CNN網絡應用于查詢圖片得到壓縮圖像,緊接著使用哈希CNN網絡得到哈希碼,計算該哈希碼和數(shù)據(jù)庫中所有哈希碼之間的漢明距離,得到漢明距離向量,將漢明距離向量中的距離數(shù)值按照從小到大的順序進行排序,按照順序輸出相應的原始圖像,得出檢索結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910334229.1/1.html,轉載請聲明來源鉆瓜專利網。





