[發明專利]基于深度神經網絡的人臉識別方法有效
| 申請號: | 201810048222.9 | 申請日: | 2018-01-18 |
| 公開(公告)號: | CN108304788B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 王峰;高新波;王楠楠 | 申請(專利權)人: | 陜西炬云信息科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06K9/62;G06N3/04;G06V10/74 |
| 代理公司: | 西安新思維專利商標事務所有限公司 61114 | 代理人: | 李罡 |
| 地址: | 710065 陜西省西安市高新區唐延南都市*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 神經網絡 識別 方法 | ||
1.一種基于深度神經網絡的人臉識別方法,其特征在于:其方法步驟包括人臉檢測,人臉對齊,特征提取和身份比對;
所述的人臉檢測、對齊的方法為:
采用由粗到細的自動編碼網絡(CFAN)檢測5個面部關鍵點,根據檢測到的5個面部關鍵點旋轉裁剪校準成256×256×3像素的正姿態人臉圖片,通過級聯多個棧式自編碼網絡,在越來越高分辨率的人臉圖像上逐步優化人臉對齊結果;
所述的特征提取和身份比對的方法為:
采用10層深度人臉網絡來提取人臉特征,所述的10層深度人臉網絡包括7個卷積層和3個全連接層,通過訓練和測試兩部分進行區別;
具體的操作步驟為:
在訓練部分先將裁剪校準后的人臉圖像經過數據擴張輸入第一個卷積層得到初級的圖像特征,該圖像特征經過ReLU非線性函數激活后通過池化Pooling操作在空間維度寬度和高度上進行降采樣,之后輸入到第二個卷積層得到新的特征,重復卷積步驟6次,直到網絡到達最后一個卷積層,在重復的6次卷積步驟中,在第三個卷積層之后加入池化操作,將最后一個卷積層輸出的高級特征通過兩個全連接層和dropout隨機失活操作進行逐層降維,之后輸入最后一個全連接層做人臉的分類,最后一個全連接層即為一個softmax分類器;
卷積層和全連接層中的參數隨著梯度下降被不斷訓練,直到網絡收斂成一個能正確識別人臉特征的深度網絡模型;在測試部分將對齊后的測試圖像經過數據擴張輸入至訓練好的網絡模型并提取第二個全連接層輸出的2048維向量作為每個人臉圖像的特征表示,身份比對使用余弦函數度量每個人臉特征之間的相似度,通過計算不同人臉圖像特征的夾角余弦來進行特征比較,夾角余弦值越大,就越為同一人;
所述的數據擴張具體操作為:從大小為256×256圖像中隨機提取大小為225×225的塊及其水平反射,提取得到的塊上訓練網絡,在測試階段,網絡通過從輸入圖像中提取5個大小為225×225的塊,5個分別為圖像的四個角塊和中心塊,并提取它們的水平反射塊,即共10個塊進行預測,平均10個塊在softmax層的輸出作為預測結果;
所述的ReLU非線性激活函數為f(x)=max(0,x),該函數將小于0的神經元輸出映射為0。
2.根據權利要求1所述的一種基于深度神經網絡的人臉識別方法,其特征在于:所述的5個面部關鍵點為左右眼的中心,鼻尖,以及左嘴角和右嘴角。
3.根據權利要求1或2所述的一種基于深度神經網絡的人臉識別方法,其特征在于:所述的池化操作指將特征圖在空間維度寬度和高度上進行降采樣,池化步長為2,尺寸大小為3×3。
4.根據權利要求3所述的一種基于深度神經網絡的人臉識別方法,其特征在于:所述的dropout隨機失活方法為神經元輸出以0.5的概率被設置為0。
5.根據權利要求4所述的一種基于深度神經網絡的人臉識別方法,其特征在于:所述的夾角余弦相似度度量為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西炬云信息科技有限公司,未經陜西炬云信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810048222.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于卷積神經網絡的道路目標檢測方法
- 下一篇:臉部識別方法及裝置





