[發明專利]一種基于深度學習細粒度人臉圖像快速檢索方法有效
| 申請號: | 201710703271.7 | 申請日: | 2017-08-16 |
| 公開(公告)號: | CN107480261B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 劉威鑫;馬雷;張雪婷 | 申請(專利權)人: | 上海荷福人工智能科技(集團)有限公司 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 成都華風專利事務所(普通合伙) 51223 | 代理人: | 徐豐;張巨箭 |
| 地址: | 201600 上海市松*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 細粒 度人 圖像 快速 檢索 方法 | ||
本發明提供了一種基于深度學習細粒度人臉圖像快速檢索方法,包括:構建深度卷積神經網絡模型,并在深度卷積神經網絡模型的各分支層添加用于計算損失函數的損失層;對深度卷積神經網絡模型的參數進行初始化;構建數據集,并按照預設比例,將所述數據集中的圖片隨機劃分成訓練集、測試集、驗證集;設定深度卷積神經網絡模型的學習參數;對深度卷積神經網絡模型進行訓練,采用隨機梯度下降和反向傳播算法更新所述深度卷積神經網絡模型的參數;對訓練后的深度卷積神經網絡模型進行測試,具體是經過粗粒度測試和細粒度測試,獲得人臉檢索結果,從而提高了圖片檢索的效率以及圖片檢索的精度。
技術領域
本發明涉及圖像檢索技術領域,尤其涉及一種基于深度學習細粒度人臉圖像快速檢索方法。
背景技術
隨著手機、監控攝設備采集圖像的便利化以及互聯網如微博、微信的普及,數據的規模呈現爆炸式地增長。這些數據大大增加了計算設備存儲及計算負擔。以人臉檢索為例,我們首先需要從百萬級數據中提取實值特征如GIST特征、LBP特征以及CNN特征。其次使用歐式距離或者內積作為相似性距離測度,對數據庫中的圖片按照與查詢圖片的相似度進行排序。存儲這些實值特征需要占用大量的計算機內存,而且計算這些實值特征之間歐式距離或者內積距離需要大量的CPU浮點運算。
哈希技術可以將實值的人臉特征轉換成二值的人臉特征(二值碼/哈希碼),并且同時保持人臉樣本之間的相似性。換而言之,通過哈希技術我們可以將人臉特征從實值空間映射到二值空間,并且使得實值空間里距離比較遠的兩張人臉在二值空間里的漢明距離比較大,相反實值空間里距離比較近的兩張人臉在二值空間里的漢明距離比較小。特征二值化后不僅節省了內存開銷,而且二值化特征之間的漢明距離可以使用異或操作快速計算。因此,我們可以使用哈希技術減少人臉樣本的存儲空間并提高人臉的檢索效率。雖然哈希技術可以幫助我們提高人臉的檢索速度,但是這種方法的檢索精度嚴重依賴于提取特征的表示能力強弱。以傳統的圖像哈希方法為例,基于手工特征如GIST、LBP等學習到的圖像二值碼未取得理想的圖像檢索效果。主要原因是這些特征的表示能力較弱。
以往基于哈希的人臉檢索算法大都采用傳統的圖像哈希算法,即從圖像中提取手工特征然后利用這些特征學習哈希碼。這種方法的缺點包括不能學習到最優的哈希碼,而且這種方式學習到的哈希碼的檢索性能不理想。
因此,現有技術中圖像檢索存在效率低,檢索精度差的技術問題。
發明內容
為了解決現有技術中圖像檢索存在效率低,檢索精度差的技術問題,本發明提供了一種基于深度學習細粒度人臉圖像快速檢索方法,進而提高了圖像檢索的效率,提高了圖像檢索的精度。
本發明主要解決的技術問題是提供一種基于深度學習細粒度人臉圖像快速檢索方法,包括如下內容:
構建深度卷積神經網絡模型,并在所述深度卷積神經網絡模型的各分支層添加用于計算損失函數的損失層;
對所述深度卷積神經網絡模型的參數進行初始化;
構建數據集,并按照預設比例,將所述數據集中的圖片隨機劃分成訓練集、測試集、驗證集;
設定深度卷積神經網絡模型的學習參數,具體包括設定深度卷積神經網絡模型中的各個損失層對應的權重,各分支層的學習率、動量因子以及權重衰減,一次輸入批量樣本的數量,網絡訓練的迭代次數;
對所述深度卷積神經網絡模型進行訓練,采用隨機梯度下降和反向傳播算法更新所述深度卷積神經網絡模型的參數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海荷福人工智能科技(集團)有限公司,未經上海荷福人工智能科技(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710703271.7/2.html,轉載請聲明來源鉆瓜專利網。





