[發明專利]一種基于遷移層次網絡的人臉識別方法在審
| 申請號: | 201810413269.0 | 申請日: | 2018-05-03 |
| 公開(公告)號: | CN108596138A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 楊育彬;甘元柱;李瑮;朱瑞 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 江蘇圣典律師事務所 32237 | 代理人: | 胡建華;于瀚文 |
| 地址: | 210023 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 層次網絡 人臉識別 訓練模型 遷移 人臉訓練數據 預處理操作 平移 人臉分類 人臉數據 隨機噪聲 相似程度 顏色增強 微調 網絡 學習 | ||
本發明公開了一種基于遷移層次網絡的人臉識別方法,包括:步驟1:選取預訓練模型。步驟2:搭建用于人臉分類的層次網絡。步驟3:根據選取的預訓練模型和已有人臉數據的相似程度確定微調的網絡層次。步驟4:針對人臉訓練數據集進行預處理操作,包括顏色增強,旋轉,平移,增加隨機噪聲等。步驟5:使用caffe深度學習庫對已有的數據進行訓練。步驟6:使用已訓練好的模型進行人臉識別。
技術領域
本發明屬于計算機視覺領域,尤其涉及一種基于遷移層次網絡的人臉識別方法。
背景技術
近年來,深度學習在計算機視覺領域取得了廣泛的應用。深度學習方法在使用比傳統方法更多的訓練集,采用更深的網絡結構后,在人臉識別方面也取得了比較明顯的進步。然而在某些場景下,由于資源、人手等成本的限制,不能獲得足夠多的有標簽訓練樣本來訓練,導致無法得到更優秀的模型。
發明內容
發明目的:本發明提出了當人臉數據較少時可采用的基于遷移層次網絡的人臉識別方案。采用已經訓練好的具有普遍意義的模型,以此模型的權值作為新模型的預值。同時不斷調整模型的學習率,這對資源有限時,使用深度學習方法進行人臉識別提供了非常有價值的借鑒意義。
本發明具體包括如下步驟:
步驟1,選取預訓練模型;
步驟2,搭建層次網絡;
步驟3,對人臉訓練數據集進行預處理;
步驟4,確定微調的網絡層次結構;
步驟5,在人臉訓練數據集上進行重訓練操作,如果在人臉訓練數據集上的準確率不理想,則轉步驟4,否則得到訓練好的模型,執行步驟6;
步驟6,對于給定的圖片,采用與步驟3中相同的方式進行相應的預處理,使用步驟5得到的已訓練好的模型進行人臉識別,給出識別結果。
步驟1所選取的預訓練模型為VGG-FACE模型。本發明采用的預訓練網絡是VGG-net,使用此預訓練網絡主要是因為該網絡的卷積核大小均相等,且網絡結構可以逐步遞進深入,之前訓練的淺層網絡的權值可以賦予深度網絡,且該網絡的權值具有一定的通用性,而且有開放專門使用此網絡訓練人臉圖像的模型;
步驟2中,搭建的層次網絡為VGG-net卷積神經網絡,卷積層步長和補齊均設置為1,卷積層共分成五組,每一組之后接池化層,初始輸入大小為224×224,初始卷積核數目為64,卷積核大小全部為3×3,兩個卷積層作為第一組,第二組同樣是兩個卷積層,池化后卷積核數目加倍為128個,第三,四,五組均為三個卷積層,卷積核數目依次為256,512,512;池化層采用最大池化方式,池化層步長大小為2,每次池化后特征圖的尺寸減半,為了保證網絡的表達能力,將卷積核的數目增加一倍;全連接層將之前提取的特征再次進行非線性變換,全連接參數為4096-4096-1000,并接Softmax進行分類(參考文獻:《數字圖像處理》岡薩雷斯/伍茲電子工業出版社),使用步驟1的預訓練模型對搭建的層次網絡初始化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810413269.0/2.html,轉載請聲明來源鉆瓜專利網。





