[發明專利]一種基于極少訓練樣本的深度圖像哈希方法有效
| 申請號: | 201811053140.X | 申請日: | 2018-09-10 |
| 公開(公告)號: | CN109472282B | 公開(公告)日: | 2022-05-06 |
| 發明(設計)人: | 耿立冰;潘炎;印鑒;賴韓江;潘文杰 | 申請(專利權)人: | 中山大學;廣州中大南沙科技創新產業園有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 訓練 樣本 深度 圖像 方法 | ||
本發明提供一種基于極少訓練樣本的深度圖像哈希方法,該方法在已有的傳統哈希方法的和基于深度學習的哈希方法都是在大量訓練樣本的前提下來進行設計的,而在真實的生產環境中,得到大量標記訓練樣本的成本很高,所以在在極少訓練樣本下,如果能得到一個效果相對較好的圖像哈希模型是具有非常大的實用價值的。
技術領域
本發明涉及圖像檢索和計算機視覺領域,更具體地,涉及一種基于極少訓練樣本的深度圖像哈希方法。
背景技術
近年來,隨著大數據和信息技術突飛猛進的發展,每一天產生的圖像數據無法估計,如何在這浩瀚的圖像數據中搜索到自己想要的圖像顯的尤為重要。同時信息檢索技術也得很大的發展和應用,在信息檢索領域中比較重要的技術之一就是圖像哈希。
對于圖像哈希技術來說,從實現角度上可分為傳統圖像哈希和基于深度學習的圖像哈希(deep hashing)。近年來,隨著深度學習的飛速發展,深度哈希已經成為了目前最領先的圖像哈希方法。深度哈希模型具有強大的表征能力,同時需要大量的訓練樣本來學習整個深度神經網絡。但是在現實環境中,往往很難得到大量的訓練樣本,因此就出現了一個問題:當某些訓練樣本很少的時候,該如何設計一個效果相對較好的哈希模型?這就是發明專利要解決的問題,因此提出了一種從已有先驗知識中學習極少新樣本的深度哈希方法(few-shot hashing)。
發明內容
本發明提供一種可得到一個效果相對較好的圖像哈希模型基于極少訓練樣本的深度圖像哈希方法。
為了達到上述技術效果,本發明的技術方案如下:
一種基于極少訓練樣本的深度圖像哈希方法,包括以下步驟:
S1:任務定義及數據劃分;
S2:構建triplet-based通用深度哈希模型;
S3:基于通用深度哈希模型構建支持記憶體;
S4:通過雙向長短期記憶子網絡和支持記憶體學習極少樣本的特征表示;
S5:訓練極少樣本下的深度圖像哈希模型,并對極少樣本的測試集進行檢索測試。
進一步地,所述步驟S1的具體過程是:
S11:以cifar100數據集為例,給出few-shot hashing的具體定義。將cifar100劃分為2部分,第一部分有80類,每一類有充足的500張訓練圖片,記作S(support set);另外一部分有20類,每一類只有少量的3張(或者5張、10張..)訓練樣本,該部分記作L(learningset)。的目的是訓練一個深度哈希模型,使得屬于這20類的圖片能夠在整個100類的圖像數據庫里進行相對有效的檢索。
進一步地,所述步驟S2的具體過程是:
S21:針對深度圖像哈希的任務,首先需要構建特征學習子網絡,即深度卷積網絡(CNN)。卷積網絡由卷積層、激活層和池化層堆疊而成,具有強大的特征表達能力;
S22:經過卷積子網絡后,每一張圖片轉換為一個語義特征向量,然后,特征向量后面加一個輸出神經元數量為q的全連接層和相應的sigmod激活函數層。這樣,每一個圖像就轉換為q維的、范圍在0~1之間的實數向量,即哈希向量;
S23:得到哈希向量后,通過三元組損失函數(triplet ranking loss)進行約束,三元組損失函數的目的就通過學習,讓相似圖片的近似哈希向量之間的距離要遠遠小于不相似圖片的哈希向量之間的距離;
S24:訓練triplet-based的通用深度哈希網絡,得到通用深度哈希模型。
進一步地,所述步驟S3的具體過程如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學;廣州中大南沙科技創新產業園有限公司,未經中山大學;廣州中大南沙科技創新產業園有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811053140.X/2.html,轉載請聲明來源鉆瓜專利網。





