[發明專利]一種復雜場景下人臉識別的深度卷積網絡及學習方法在審
| 申請號: | 201710531386.2 | 申請日: | 2017-07-03 |
| 公開(公告)號: | CN107194380A | 公開(公告)日: | 2017-09-22 |
| 發明(設計)人: | 唐良智;王兵;魏湘臣 | 申請(專利權)人: | 上海荷福人工智能科技(集團)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/40;G06K9/66;G06T5/00;G06T5/10 |
| 代理公司: | 成都華風專利事務所(普通合伙)51223 | 代理人: | 徐豐 |
| 地址: | 201600 上海市松*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 復雜 場景 下人 識別 深度 卷積 網絡 學習方法 | ||
技術領域
本發明涉及一種復雜場景下人臉識別的深度卷積網絡及學習方法,屬于計算機技術領域。
背景技術
早期的人臉識別算法主要包括對圖像預處理,提出如LBP等傳統人臉特征以及應用向量機對所提取到的特征進行學習和分類。其中圖像預處理算法尤為關鍵,具體包括針對不同光照條件下的預處理算法,針對圖像噪聲的去噪算法,以及針對不同角度人臉對像的對齊算法。在專門針對某一個人臉識別數據庫的優化后,例如經典的LFW人臉識別數據庫,已經取得了與人類識別水平相近的結果。
而近年來,隨著種類繁多的拍攝設備的快速增加,呈指數級增長的人臉圖像大量的出現在各類拍攝圖像和視頻中,尤其是來自手機設備和監控設備的拍攝。隨之而來的則是針對人臉識別應用出現了大量需求,其中包括基于人臉的身份認證,基于人臉識別的圖像檢索,基于監控視頻的特定人臉識別等應用。如今的人臉識別技術已告別在小規模數據庫上進行算法優化的時期,轉而進入了需要對大量各種環境下拍攝的人臉圖像進行精確識別的應用時期。然而,隨著拍攝自各種環境的包括人臉的數字圖像的急速增多,而拍攝者的水平又良莠不齊的環境下,如前所述的早期人臉識別技術在此類真實環境中的人臉識別精度迅速下降,已遠不能滿足現實的應用需求。
發明內容
為解決上述技術問題,本發明采用的一個技術方案是:一種復雜場景下人臉識別的深度卷積網絡,其特征在于:包括多個卷積模塊和全連接模塊,所述每個卷積模塊或者全連接模塊由不同尺度下的卷積核、激活函數和池化函數組成,。
進一步的,所述卷積模塊一共4個,全連接模塊一共3個,其中,前3個卷積模塊分別由卷積層,relu曾和最大池化層組成,最大池化層負責下采樣的操作,以多層金字塔下采樣的結構對圖像進行深度多層濾波的操作。
進一步的,所述卷積網絡從第一層到最后一層的具體算法以及隱藏層輸入輸出以如下公式實現:
1)其中X0∈R224×224×3,w1∈R3×3×32。
2)X2=max{0,X1},其中X1∈R224×224×32。
3)其中X2∈R224×224×32,w3∈R3×3×32×64。
4)X4=max{0,X3},其中X3∈R224×224×64。
5)其中X4∈R224×224×64,w5∈R3×3×64×128
6)X6=max{0,X5},其中X5∈R224×224×128
7)X7=maxpool(X6),其中X6∈R224×224×128
8)其中X7∈R112×112×128,w8∈R3×3×128×128
9)X9=max{0,X8},其中X8∈R112×112×128
10)其中X9∈R112×112×128,w10∈R3×3×128×256
11)X11=max{0,X10},其中X10∈R112×112×256
12)其中X11∈R112×112×256,w12∈R3×3×256×256
13)X13=max{0,X12},其中X12∈R112×112×256
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海荷福人工智能科技(集團)有限公司,未經上海荷福人工智能科技(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710531386.2/2.html,轉載請聲明來源鉆瓜專利網。





