[發明專利]一種聯合性別屬性訓練的人臉識別網絡模型構建方法有效
| 申請號: | 202010115979.2 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111339931B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 黃俊潔;閆超;孫亞楠 | 申請(專利權)人: | 四川翼飛視科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
| 代理公司: | 成都佳劃信知識產權代理有限公司 51266 | 代理人: | 史姣姣 |
| 地址: | 610000 四川省成都市高新*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聯合 性別 屬性 訓練 識別 網絡 模型 構建 方法 | ||
1.一種聯合性別屬性訓練的人臉識別網絡模型構建方法,其特征在于,包括以下步驟:
從前至后按卷積層、批正則化層、參數修正線性單元層和擠壓激活單元模塊的順序封裝成殘差塊,并以預設的數量復制依次排布;
從前至后按照卷積層、批正則化層、參數修正線性單元層、數個殘差塊的順序依次堆疊,得到網絡塊;復制并依次排布網絡塊,以構成主干特征提取網絡結構;
在所述主干特征提取網絡結構添加隨機失活層,并在尾端加入并行分支的標準全連接層和帶正則化的全連接層,得到網絡結構模型;
分別求得標準全連接層和帶正則化的全連接層的輸出值的總損失值;
采用帶動量的隨機梯度下降法優化網絡結構模型參數;
設定迭代次數,并重復總損失值計算和網絡結構模型參數優化,直至獲得最優的人臉識別網絡模型,所述人臉識別網絡模型由4個網絡塊依次堆疊構成;所述網絡塊中包含的殘差塊數量依次為2、4、8、2,且人臉識別網絡模型包含36層卷積層,所述采用帶動量的隨機梯度下降法優化網絡結構模型參數,包括以下步驟:
設定學習率為0.01,并采用預熱余弦學習率下降調整目標函數的收斂程度;
設定隨機梯度下降法的動量參數為0.9;
網絡結構進行一次前饋傳播計算出總損失值;
采用帶動量的隨機梯度下降法優化網絡參數,重復計算總損失值,直至損失值收斂得到最優解,
所述分別求得標準全連接層和帶正則化的全連接層的輸出值的總損失值,包括以下步驟:
采用柔性最大值損失函數求得標準全連接層分支的輸出值的第一損失值;
采用附加間隔的柔性最大值損失函數求得帶正則化的全連接層分支的輸出值的第二損失值;
將第一損失值與第二損失值按比例求和,得到輸出值的總損失值,
所述總損失值對應的損失函數推導過程如下:
所述柔性最大損失函數的表達式如下:
其中,參數N表示批處理樣本的大小,n表示類數,xi表示第i個樣本的特征向量,表示真實樣本標簽yi對應的網絡權重值的轉置,表示預測為j類標簽對應的網絡權重值的轉置;
所述附加間隔的柔性最大值損失函數的表達式如下:
其中,s表示縮放因子,m表示距離調節因子,c表示類別的總數;
總損失值對應的損失函數的表達式為:
Loss=L2+λL1
其中,λ表示權重因子,即性別分類分支損失值的量級和加快網絡損失值的收斂速度,所述權重因子λ的取值為0.1。
2.根據權利要求1所述的一種聯合性別屬性訓練的人臉識別網絡模型構建方法,其特征在于,所述迭代次數為15000次。
3.根據權利要求1所述的一種聯合性別屬性訓練的人臉識別網絡模型構建方法,其特征在于,所述縮放因子S取值為40,且距離調節因子m取值為0.4。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川翼飛視科技有限公司,未經四川翼飛視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010115979.2/1.html,轉載請聲明來源鉆瓜專利網。





