[發(fā)明專利]視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法及人臉活體檢測方法在審
| 申請?zhí)枺?/td> | 201710478893.4 | 申請日: | 2017-06-21 |
| 公開(公告)號: | CN107301396A | 公開(公告)日: | 2017-10-27 |
| 發(fā)明(設(shè)計)人: | 張少林;李衛(wèi)軍;韋美麗;寧欣;董肖莉 | 申請(專利權(quán))人: | 北京市威富安防科技有限公司;中國科學院半導(dǎo)體研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/06;G06N3/08 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11371 | 代理人: | 徐彥圣 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 造假 卷積 神經(jīng)網(wǎng)絡(luò) 訓練 方法 活體 檢測 | ||
1.一種視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法,其特征在于,所述方法包括:
構(gòu)建訓練集,所述訓練集包括視頻造假視頻和真人視頻;
獲取視頻造假視頻和真人視頻中的圖像;
通過人臉檢測算法檢測所述圖像中的人臉;
將所述人臉進行裁剪;
對裁剪后出人臉圖像進行歸一化處理;
將所述歸一化后的人臉圖像輸入至卷積神經(jīng)網(wǎng)絡(luò),所述卷積神經(jīng)網(wǎng)絡(luò)包括輸入層、多個卷積層、ReLU層、max-pooling層、全連接層、Dropout層和SoftmaxWithLoss層;
所述輸入層將所述歸一化后的人臉圖像進行隨機裁剪,將裁剪后的人臉圖像水平翻轉(zhuǎn),得到特定像素的圖像,將所述特定像素的圖像送入多個卷積層中的第一個卷積層;
所述第一個卷積層包括多個卷積核,所述第一個卷積層連接一個ReLU層和max-pooling層,所述特定像素的圖像經(jīng)過所述第一個卷積層后得到與所述第一個卷積層的卷積核對應(yīng)數(shù)量的特征圖像,所述ReLU層使部分神經(jīng)元輸出為0,造成稀疏性,所述max-pooling層對所述特征圖像進行壓縮,提取主要特征,所述特征圖像進入第二個卷積層;
所述第二個卷積層包括多個卷積核,所述第二個卷積層連接一個ReLU層和max-pooling層,所述特征圖像經(jīng)過所述第二個卷積層后得到與所述第二個卷積層的卷積核對應(yīng)數(shù)量的特征圖像,所述ReLU層使部分神經(jīng)元輸出為0,造成稀疏性,所述特征圖像經(jīng)過第二個max-pooling層后進而進入第三個卷積層;
所述第三個卷積層包括多個卷積核,所述第三個卷積層連接一個ReLU層和max-pooling層,所述特征圖像經(jīng)過所述第三個卷積層后得到與所述第三個卷積層的卷積核對應(yīng)數(shù)量的特征圖像,所述ReLU層使部分神經(jīng)元輸出為0,造成稀疏性,所述特征圖像經(jīng)過第三個max-pooling層后進而進入第四個卷積層;
所述第四個卷積層包括多個卷積核,所述第四個卷積層連接一個ReLU層和max-pooling層,隨后連接兩個全連接層,每個全連接層均依次連接一個ReLU層和dropout層,所述特征圖像經(jīng)過所述第四個卷積層后得到與所述第四個卷積層的卷積核對應(yīng)數(shù)量的特征圖像,所述ReLU層使部分神經(jīng)元輸出為0,造成稀疏性,所述特征圖像經(jīng)過第四個max-pooling層后進而進入兩個全連接層以及與所述全連接層連接的ReLU層和dropout層;
dropout層通過訓練時,隨機讓卷積神經(jīng)網(wǎng)絡(luò)某些隱含層節(jié)點的權(quán)重不工作,dropout層之后依次連接一個全連接層和SoftmaxWithLoss層,最后一個全連接層輸出所述人臉圖像的得分情況,將得分輸入到最后一層SoftmaxWithLoss層,得到屬于視頻造假和真人的概率以及該次迭代的損失。
2.根據(jù)權(quán)利要求1所述的視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法,其特征在于,每一個所述卷積層和ReLU層之間均依次連接一個BatchNorm層和一個Scale層,所述BatchNorm層將神經(jīng)元的輸出規(guī)范化到均值為0,方差為1,所述Scale層逆轉(zhuǎn)所述BatchNorm層對特征的破壞。
3.根據(jù)權(quán)利要求1所述的視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法,其特征在于,所述構(gòu)建訓練集的步驟包括:
按照預(yù)定比例構(gòu)建訓練集和驗證集,所述訓練集和驗證集均包括視頻造假視頻和真人視頻。
4.根據(jù)權(quán)利要求1所述的視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法,其特征在于,所述對裁剪后出人臉圖像進行歸一化處理的步驟包括:
對裁剪后出人臉圖像歸一化到256×256像素。
5.根據(jù)權(quán)利要求1所述的視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法,其特征在于,所述輸入層包含RGB三個通道,大小為256×256,將訓練集分為1000個batch,每個batch大小為128,所述特定像素的圖像的像素為227×227。
6.根據(jù)權(quán)利要求1-5任一項所述的視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法,其特征在于,所述第一個卷積層包括96個卷積核,每個卷積核的大小為7×7,卷積操作的步長為2,經(jīng)過第一個卷積層后得到96個像素為111×111的特征圖像,經(jīng)過第一個max-pooling層后,得到96個像素為55×55的特征圖像,所述第一個max-pooling層的大小為3×3,步長為2。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京市威富安防科技有限公司;中國科學院半導(dǎo)體研究所,未經(jīng)北京市威富安防科技有限公司;中國科學院半導(dǎo)體研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710478893.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 移動臺及其防攻擊的方法
- 人造假山
- 面具造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法及人臉活體檢測方法
- 視頻造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法及人臉活體檢測方法
- 照片造假卷積神經(jīng)網(wǎng)絡(luò)訓練方法及人臉活體檢測方法
- 基于高維異常檢測模型的環(huán)境監(jiān)測數(shù)據(jù)造假手段識別方法
- 財務(wù)造假風險監(jiān)控方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種基于LBP紋理的焊縫探傷底片圖像造假的檢測方法
- 一種基于大數(shù)據(jù)的企業(yè)財務(wù)造假識別系統(tǒng)
- 上市公司疑似財務(wù)造假行為洞察判別系統(tǒng)
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





