[發明專利]一種基于深度卷積神經網絡的二維人臉識別模型的訓練方法在審
| 申請號: | 201611011753.8 | 申請日: | 2016-11-17 |
| 公開(公告)號: | CN106845330A | 公開(公告)日: | 2017-06-13 |
| 發明(設計)人: | 俞進森 | 申請(專利權)人: | 北京品恩科技股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 安徽匯樸律師事務所34116 | 代理人: | 劉海涵 |
| 地址: | 100094 北京市海淀區豐*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 卷積 神經網絡 二維 識別 模型 訓練 方法 | ||
技術領域
本發明涉及的是一種模式識別中的生物特征識別領域,主要涉及一種基于深度卷積神經網絡的二維人臉識別模型的訓練方法。
背景技術
人臉識別主要用于身份識別,特別是近年來隨著計算機技術、圖像處理技術、模式識別技術等快速進步,而出現的一種嶄新的生物特征識別技術。由于可廣泛應用于安全驗證、視頻監控、出入口控制等諸多領域,識別速度快、識別率高,因此已經成為身份識別技術研究領域主要的發展方向
目前主流的人臉識別在需要配合的基礎上獲取人臉圖像,應用分類算法進行人臉識別。主要有以下幾類方法:(1)基于幾何特征的方法:檢測臉部器官如眼睛、眉毛、鼻子、嘴巴和下巴等,利用各個器官的位置、大小及相互之間的空間分布關系來識別人臉;(2)基于子空間的方法:將人臉圖像經過投影變換投射至子空間中,由于投影變換具有非正交、非線性的特性,因此子空間中的人臉表示更具分辨力;(3)基于局部特征的方法:利用各類局部算子計算出相應的人臉圖像,通過統計其直方圖,利用直方圖信息進行識別。
這些方式在實際監控時,容易受到光線變化、背景、姿態等諸多因素的干擾,使得提取的特征在以上外界因素發生變化時,導致原始圖像出現結構丟失、特征描述不全面和不確定等問題,這些缺陷導致人臉識別率低,可靠性差,無法進行大面積推廣等。因此在實際監控惡劣的環境下實現準確快速的人臉識別技術成為當前具有挑戰性的問題。
發明內容
本發明的目的在于克服現有技術的不足,提供了一種基于深度卷積神經網絡的二維人臉識別模型的訓練方法,以解決在光線、背景、姿態等諸多因素的干擾下,人臉識別率低、可靠性差等技術問題。
本發明是通過以下技術方案實現的:
本發明提供了一種基于深度卷積神經網絡的二維人臉識別模型的訓練方法,包括以下步驟:
步驟S1:采集人臉圖像樣本,采用基于Haar特征的Adaboost算法得到樣本圖像中的人臉區域;
步驟S2:將樣本圖像中的人臉區域進行定比例擴展,然后截取部分人臉區域的圖像,縮放后通過灰度處理獲得灰度圖像;
步驟S3:構建初步的人臉卷積神經網絡模型,將灰度圖像輸入人臉卷積神經網絡進行訓練,得到全連接層的人臉高層次特征值,根據該特征值與其理想值的差距,調整模型的權值矩陣,獲得訓練后的人臉識別卷積神經網絡模型;
步驟S4:對特征值進行L2范數歸一化,獲得人臉圖像的特征表示;
步驟S5:從樣本中隨機選擇某個人的灰度圖像作為錨點,選擇該人其它圖像生成的特征值與錨點之間的距離最大的一張灰度圖像作為正樣本,選擇其他人圖像生成的特征值與錨點之間的距離最小的一張灰度圖像作為負樣本,構建獲得由錨點、正樣本和負樣本組成的三元組;利用目標函數進行篩選,選擇不滿足目標函數的三元組為最難區分三元組;
步驟S6:精調卷積神經網絡模型:將選取的最難區分三元組輸入人臉識別卷積神經網絡模型進行訓練、精調,再次獲得相應的特征值,重復步驟S4-S5,利用上一輪訓練好的人臉識別卷積神經網絡模型,進行下一輪最難三元組選擇和訓練,通過最后生成的特征值計算待測人臉圖像的歐式距離,將歐式距離與設定閾值比較,判斷是否為同一人,從而獲取人臉識別的正確率和誤識率;
步驟S7:多次迭代優化直到人臉識別卷積神經網絡模型收斂,直至迭代收斂,即人臉識別的正確率的評價標準達到最高值,獲得最終用于識別的人臉識別卷積神經網絡模型,訓練結束。
進一步地,所述步驟S3的步驟包括:
步驟S301:構建共有22層的深度卷積神經網絡,每層的各個神經元的初始權值、參數全部通過隨機函數生成,大小為正負1之間,每層采用的卷積核分別為1、3、5,卷積步長為1,卷積間隔為0、1、2,同時網絡中每層數據使用3×3的矩陣池化,完成初步構建;
步驟S302:前向傳播:將灰度圖像輸入到深度卷積神經網絡里面,通過整個網絡一步步收斂,使維度一層層降低,最后輸出128維的人臉高層次特征值Op;
步驟S303:反向傳播:計算Op與相應的理想輸出值Yp的差,按極小化誤差的方法調整權值矩陣,獲得訓練后的人臉識別卷積神經網絡模型。
進一步地,所述步驟S5中,目標函數的公式為:
式中,表示錨點的特征表示,表示正樣本的特征表示,表示負樣本的特征表示,a代表兩者距離之間的最小間隔,L代表三元組損失,三元組選擇即選擇損失大于零的情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京品恩科技股份有限公司,未經北京品恩科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611011753.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種伺服電機過熱保護方法
- 下一篇:一種低成本無線充電無源中繼器





