[發明專利]基于強化學習和深度卷積神經網絡的人臉識別裝置及方法在審
| 申請號: | 202111129227.2 | 申請日: | 2021-09-26 |
| 公開(公告)號: | CN113822203A | 公開(公告)日: | 2021-12-21 |
| 發明(設計)人: | 涂曉光;李軍輝;胡焱;劉建華;康朋新 | 申請(專利權)人: | 中國民用航空飛行學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 成都厚為專利代理事務所(普通合伙) 51255 | 代理人: | 王杰 |
| 地址: | 618300 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 強化 學習 深度 卷積 神經網絡 識別 裝置 方法 | ||
1.基于強化學習和深度卷積神經網絡的人臉識別裝置,其特征在于,包括主網絡塊、若干歸一化網絡和若干決策網絡,所述主網絡包括若干順次連接的主網絡塊,所述若干歸一化網絡與除最后一個主網絡塊以外的所有主網絡塊一一對應連接,所述若干決策網絡與所述若干歸一化網絡一一對應連接;
所述主網絡塊用于對輸入的人臉圖像和人臉特征進行特征提取,并輸出提取得到的人臉特征;
所述歸一化網絡用于將其對應的主網絡塊輸出的人臉特征歸一化到同一特征投影空間并輸出;
所述決策網絡用于根據其對應的歸一化網絡輸出的人臉特征,利用強化學習方法判斷是否繼續向前學習:若是,則將所述歸一化網絡輸出的人臉特征輸入下一個主網絡塊;若否,則將所述歸一化網絡輸出的人臉特征輸出進行人臉識別。
2.根據權利要求1所述的基于強化學習和深度卷積神經網絡的人臉識別裝置,其特征在于,所述主網絡為深度殘差網絡。
3.根據權利要求1所述的基于強化學習和深度卷積神經網絡的人臉識別裝置,其特征在于,所述特征歸一化網絡利用綜合歸一化損失函數對人臉特征進行歸一化處理,所述綜合歸一化損失函數為:
Lc=Le+λLd
式中,λ是平衡特征歸一化損失函數Le和身份判別損失函數Ld的權重因子;M表示主網絡的網絡塊數量;N表示的是訓練過程中每一個mini-batch的樣本數量;E(·)表示歸一化網絡的特征轉換過程,fi,j表示每一個mini-batch所包含的第j個樣本經第i個主網絡塊所處理得到的特征,fj表示的是每一個mini-batch所包含的第j個樣本經最后一個主網絡塊所得到的特征;LArc定義的是ArcFace人臉損失函數,用來提取人臉的身份信息。
4.根據權利要求1所述的基于強化學習和深度卷積神經網絡的人臉識別裝置,其特征在于,所述決策網絡利用決策網絡損失函數進行訓練學習,所述決策網絡損失函數為:
式中,表示第i個主網絡塊的第j個樣本選取Action為s時的預測值,M表示主網絡塊的數量,N表示每個mini-batch包含的樣本數,R(Sl,Sl+1)表示狀態Sl到Sl+1所產生的獎勵值。
5.基于強化學習和深度卷積神經網絡的人臉識別方法,應用于權利要求1-4任意一項所述的人臉識別裝置,其特征在于,包括:
S1.將人臉圖像輸入第一個主網絡塊;
S2.主網絡塊對輸入的人臉圖像和人臉特征進行特征提取;
S3.判斷所述主網絡塊是否為最后一個主網絡塊,若是,則輸出提取得到的人臉特征進行人臉識別,否則將提取到的人臉特征輸入該主網絡塊對應的歸一化網絡;
S4.歸一化網絡對輸入的人臉特征進行歸一化處理,并將歸一化后的人臉特征輸入其對應的決策網絡;
S5.決策網絡根據其對應的歸一化網絡輸出的人臉特征,利用強化學習方法判斷是否繼續向前學習:若是,則執行S6,若否,則執行S7;
S6.將所述歸一化網絡輸出的人臉特征輸入下一個主網絡塊,并執行S2;
S7.將所述歸一化網絡輸出的人臉特征輸出進行人臉識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國民用航空飛行學院,未經中國民用航空飛行學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111129227.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種顯示面板及顯示裝置
- 下一篇:一種雙極膜電滲析生產次磷酸的工藝





