[發明專利]基于深度學習和哈希的圖像檢索方法有效
| 申請號: | 201510901348.2 | 申請日: | 2015-12-07 |
| 公開(公告)號: | CN105512289B | 公開(公告)日: | 2018-08-14 |
| 發明(設計)人: | 張晨民;趙慧琴;彭天強 | 申請(專利權)人: | 鄭州金惠計算機系統工程有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 鄭州大通專利商標代理有限公司 41111 | 代理人: | 陳大通 |
| 地址: | 450000 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 哈希函數 圖像檢索 量化誤差 哈希 卷積神經網絡 準確率 圖像底層特征 內在關系 深度特征 特征表達 提取圖像 圖像特征 學習能力 二值化 分類器 哈希碼 學習 檢索 圖像 挖掘 引入 | ||
1.一種基于深度學習和哈希的圖像檢索方法,具體包含如下步驟:
步驟1.將圖像數據集及其對應的類別標簽信息分別對應分成兩部分,一部分作為訓練樣本集,另一部分作為測試樣本集,其中,訓練樣本集和測試樣本集中每個樣本均包括一張圖像及對應的類別標簽;
步驟2.構建深度卷積神經網絡架構,深度卷積神經網絡架構包含卷積子網絡、哈希層、損失層,卷積子網絡用于學習圖像特征,哈希層包括全連接層、激活層和閾值化層,用于學習哈希函數的構建并得到輸入圖像的哈希碼,損失層包括Softmax分類器損失模塊和量化誤差損失模塊;輸入圖像通過卷積子網絡得到圖像特征x(i),進入哈希層,假設需要生成哈希碼的長度為q,全連接層將圖像特征x(i)映射為q維向量,即f(x(i))=Wx(i),其中,W表示全連接層的參數矩陣;激活層使用雙正切激活函數將q維向量映射為值域在[-1,1]之間的q維向量,即其中,v=f(x(i)),參數β用于控制平滑度;閾值化層將激活層的值進行量化,其中,s=tanh(f(x(i))),閾值化層的輸出為二進制哈希碼;
步驟3.利用訓練樣本集,依據深度卷積神經網絡架構,得到深度卷積神經網絡模型;
步驟4.根據深度卷積神經網絡模型,將訓練樣本集和測試樣本集中的每張圖像作為輸入,得到訓練樣本集的哈希碼Htrain和測試樣本集的哈希碼Htest;
步驟5.從Htest取一個測試圖像的哈希碼Ht,計算該哈希碼Ht與訓練樣本集哈希碼Htrain之間的漢明距離,得到漢明距離向量;
步驟6.漢明距離向量中的數值按從小到大的順序進行排序,按順序輸出對應的原始圖像,得到圖像檢索結果。
2.根據權利要求1所述的基于深度學習和哈希的圖像檢索方法,其特征在于:步驟2中卷積子網絡包括多個卷積層,池化層和全連接層。
3.根據權利要求1中所述的基于深度學習和哈希的圖像檢索方法,其特征在于:步驟2中的量化誤差損失模塊,用于獲得激活層輸出的連續值與閾值化層輸出的哈希碼之間誤差損失其中,h=g(tanh(f(x(i))))為閾值化層輸出的哈希碼,x=tanh(f(x(i)))為激活層輸出的連續值。
4.根據權利要求1或3所述的基于深度學習和哈希的圖像檢索方法,其特征在于:損失層損失函數為Lloss=LsoftmaxLoss+λLq,其中,為Softmax分類器損失模塊的誤差損失,Lq為量化誤差損失模塊的誤差損失,λ為權重因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州金惠計算機系統工程有限公司,未經鄭州金惠計算機系統工程有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510901348.2/1.html,轉載請聲明來源鉆瓜專利網。





