[發明專利]面具造假卷積神經網絡訓練方法及人臉活體檢測方法在審
| 申請號: | 201710478892.X | 申請日: | 2017-06-21 |
| 公開(公告)號: | CN107194376A | 公開(公告)日: | 2017-09-22 |
| 發明(設計)人: | 張少林;李衛軍;韋美麗;寧欣;董肖莉 | 申請(專利權)人: | 北京市威富安防科技有限公司;中國科學院半導體研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙)11371 | 代理人: | 徐彥圣 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面具 造假 卷積 神經網絡 訓練 方法 活體 檢測 | ||
技術領域
本發明涉及人臉活體檢測領域,具體而言,涉及一種面具造假卷積神經網絡訓練方法及人臉活體檢測方法。
背景技術
由于人臉容易獲取、非接觸式、使用方便等優點,人臉識別受到人們的喜愛,廣泛應用在門禁出入境管理系統、登錄系統等。隨著智能設備的普及,人臉易被他人獲取,通過面具、照片或者視頻對人臉識別系統進行攻擊。因此,在人臉識別系統中,人臉活體檢測變得非常重要,是保證用戶安全的不可或缺的手段,也是人臉識別得到廣泛推廣的前提。
發明內容
有鑒于此,本發明實施例的目的在于提供一種面具造假卷積神經網絡訓練方法及人臉活體檢測方法,以提供一種應對面具造假的人臉活體檢測方法。
為了達到上述的目的,本發明實施例采用的技術方案如下所述:
第一方面,本發明實施例提供了一種面具造假卷積神經網絡訓練方法,所述方法包括:構建訓練集,所述訓練集包括面具造假視頻和真人視頻;獲取面具造假視頻和真人視頻中的圖像;通過人臉檢測算法檢測所述圖像中的人臉;將所述人臉進行裁剪;對裁剪后出人臉圖像進行歸一化處理;將所述歸一化后的人臉圖像輸入至卷積神經網絡,所述卷積神經網絡包括輸入層、多個卷積層、ReLU層、max-pooling層、全連接層、Dropout層和SoftmaxWithLoss層;所述輸入層將所述歸一化后的人臉圖像進行隨機裁剪,將裁剪后的人臉圖像水平翻轉,得到特定像素的圖像,將所述特定像素的圖像送入多個卷積層中的第一個卷積層;所述第一個卷積層包括多個卷積核,所述第一個卷積層連接一個ReLU層和max-pooling層,所述特定像素的圖像經過所述第一個卷積層后得到與所述第一個卷積層的卷積核對應數量的特征圖像,所述ReLU層使部分神經元輸出為0,造成稀疏性,所述max-pooling層對所述特征圖像進行壓縮,提取主要特征,所述特征圖像進入第二個卷積層;所述第二個卷積層包括多個卷積核,所述第二個卷積層連接一個ReLU層和max-pooling層,所述特征圖像經過所述第二個卷積層后得到與所述第二個卷積層的卷積核對應數量的特征圖像,所述ReLU層使部分神經元輸出為0,造成稀疏性,所述特征圖像經過第二個max-pooling層后進而進入第三個卷積層;所述第三個卷積層包括多個卷積核,所述第三個卷積層連接一個ReLU層和max-pooling層,所述特征圖像經過所述第三個卷積層后得到與所述第三個卷積層的卷積核對應數量的特征圖像,所述ReLU層使部分神經元輸出為0,造成稀疏性,所述特征圖像經過第三個max-pooling層后進而進入第四個卷積層;所述第四個卷積層包括多個卷積核,所述第四個卷積層連接一個ReLU層和max-pooling層,隨后連接兩個全連接層,每個全連接層均依次連接一個ReLU層和dropout層,所述ReLU層使部分神經元輸出為0,造成稀疏性,所述特征圖像經過所述第四個卷積層后得到與所述第四個卷積層的卷積核對應數量的特征圖像,經過第四個max-pooling層后進而進入兩個全連接層以及與所述全連接層連接的ReLU層和dropout層,dropout層通過訓練時,隨機讓卷積神經網絡某些隱含層節點的權重不工作,dropout層之后依次連接一個全連接層和SoftmaxWithLoss層,最后一個全連接層輸出所述人臉圖像的得分情況,將得分輸入到最后一層SoftmaxWithLoss層,得到屬于面具造假和真人的概率以及該次迭代的損失。
進一步地,每一個所述卷積層和ReLU層之間均依次連接一個BatchNorm層和一個Scale層,所述BatchNorm層將神經元的輸出規范化到均值為0,方差為1,所述Scale層逆轉所述BatchNorm層對特征的破壞。
進一步地,所述構建訓練集的步驟包括:按照預定比例構建訓練集和驗證集,所述訓練集和驗證集均包括面具造假視頻和真人視頻。
進一步地,所述對裁剪后出人臉圖像進行歸一化處理的步驟包括:對裁剪后出人臉圖像歸一化到256×256像素。
進一步地,所述輸入層包含RGB三個通道,大小為256×256,將訓練集分為1000個batch,每個batch大小為128,所述特定像素的圖像的像素為227×227。
進一步地,所述第一個卷積層包括96個卷積核,每個卷積核的大小為7×7,卷積操作的步長為2,經過第一個卷積層后得到96個像素為111×111的特征圖像,經過第一個max-pooling層后,得到96個像素為55×55的特征圖像,所述第一個max-pooling層的大小為3×3,步長為2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市威富安防科技有限公司;中國科學院半導體研究所,未經北京市威富安防科技有限公司;中國科學院半導體研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710478892.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種PPS纖維階梯度耐高溫針刺氈
- 下一篇:多功能可調空氣過濾器





