[發明專利]基于深度可分離卷積的人臉活體識別模型壓縮和移植方法有效
| 申請號: | 202011435882.6 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112861602B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 謝巍;周延;陳定權;許練濠 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V40/40;G06V10/774;G06V10/82;G06N3/0464 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 何淑珍;江裕強 |
| 地址: | 511458 廣東省廣州市南沙區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 可分離 卷積 活體 識別 模型 壓縮 移植 方法 | ||
1.基于深度可分離卷積的人臉活體識別模型壓縮和移植方法,其特征在于,包括以下步驟:
S1、通過數據增強的方式進行訓練;
S2、利用卷積神經網絡對訓練數據集的圖像進行訓練,并保存訓練后得到的卷積神經網絡模型;
S3、基于深度可分離卷積對卷積神經網絡模型進行壓縮;
S4、通過對卷積神經網絡模型權重進行半精度Float16量化進一步壓縮模型,將壓縮后的卷積神經網絡模型移植到移動端中;所述的量化是將連續取值的浮點型模型權重或流經模型的張量數據定點近似離散值的過程,以更少位數的數據類型用于近似表示32位有限范圍浮點型數據的過程,而模型的輸入輸出依然是浮點型;
所述的量化方法如下:
通過模型量化橋接定點與浮點,建立有效的數據映射關系:
由浮點到定點的量化公式如下:
由定點到浮點反量化公式如下:
R=(Q-Z)*S
其中,R表示真實的浮點值,Q表示量化后的定點值,Z表示0浮點值對應的量化定點值,S則為定點量化后可表示的最小刻度,S和Z的求值公式如下:
Rmax表示最大的浮點值,Rmin表示最小的浮點值,Qmax表示最大的定點值,Qmin表示最小的定點值;
步驟S1所述的訓練數據集通過以下方式獲得:
根據CASIA-FASD數據集中的視頻,逐幀從圖像中剪出人臉,這些圖像構成訓練數據集的一部分;拍攝不同場景下的真假臉的樣本圖片作為訓練數據集的另一部分,并對訓練數據集進行圖像亮度、對比度、飽和度隨機調整,隨機旋轉的數據增強處理;
步驟S2改進的卷積神經網絡結構如下:
所述基于深度可分離卷積改進的VGG11網絡,改進的VGG11網絡包括11個卷積層和三個全連接層,前面六層卷積層分別為三組深度可分離卷積,每層卷積層后面加ReLU層即卷積層+ReLU層,每兩個卷積層+ReLU層后面連接一個最大池化層和一個隨機失活層即dropout,最后的三個隨機失活層后面分別連接一層全連接層,每個全連接層后面連接有ReLU層,最后的ReLU層連接softmax層;在前兩個卷積層的輸出中,每個卷積層連接一個批量歸一化(Batch?Normalization,BN)層,BN層連接一個最大池化層,該最大池化層再與一個隨機失活層連接;
改進的卷積神經網絡的訓練方式如下:
1)對前兩層卷積層的輸出進行批量歸一化(Batch?Normalization),批量歸一化原理公式如下:
其中x(k)是輸入的第k維向量,E[x(k)]為x(k)的均值,Var[x(k)]為x(k)的方差;
2)對每層卷積層輸出使用dropout;
3)學習率采用衰減學習率,在訓練改進的卷積神經網絡時,使用學習率控制參數的更新速度;
采用dropout的VGG11網絡結構計算公式如下:
rj(l)~Bernoulli(p)
y(l)=r(l)*y(l)
zi(l+1)=wi(l+1)yl+bi(l+1)
yi(l+1)=f(zi(l+1))
其中,zi(l+1)是改進后的卷積神經網絡中某層的輸出,yi(l+1)是改進后的卷積神經網絡的最終輸出,y(l)是經過dropout操作后的某層神經元輸出值,Bernoulli函數是為了隨機生成一個0或者1的向量rj(l),y(l)是改進后的卷積神經網絡的第l層輸出,yl為經過dropout處理后的第l層輸出,wi(l+1)為改進后的卷積神經網絡的l+1層的權重,bi(l+1)為改進后的卷積神經網絡的l+1層的偏置,p為神經元的激活概率;
BN層批量歸一化如下:
考慮一個大小為m的向量B={x1...,xi,xm},xi為向量中的元素,以及兩個待學習的參數γ和β,用來保持模型的表達能力,則經過BN層后的輸出yi=BNγ,β(xi)
yi=γxi+β≡BNγ,β(xi)
其中,μΒ是最小批次均值,σΒ2是最小批次方差,xi為歸一化后的xi,ε為常量;
所述改進的卷積神經網絡輸入層的圖像進行預處理后再進行卷積;所述預處理包括將圖像縮放為統一的大小;
步驟S3所述壓縮方法基于深度可分離卷積,具體如下:
假設輸入特征圖尺寸為DF×DF×M,卷積核尺寸為DK×DK×M,輸出特征圖尺寸為DF×DF×N,標準卷積層的參數量為:(DK×DK×M)×N;
其中,DF為輸入特征圖的邊長,M為輸入特征圖的通道數;DK為卷積核的邊長,N為輸出特征圖的通道數;
深度卷積參數量為(DK×DK×1)×M,深度卷積負責濾波,作用在輸入的每個通道上;逐點卷積參數量為(1×1×M)×N,逐點卷積負責轉換通道,作用在深度卷積的輸出特征映射上,兩者合即為深度可分離卷積;
深度可分離卷積參數量為標準卷積:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011435882.6/1.html,轉載請聲明來源鉆瓜專利網。





