[發明專利]人臉識別模型的訓練方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010592670.2 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111783607B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 田飛;溫圣召;楊馥魁 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/82 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 模型 訓練 方法 裝置 電子設備 存儲 介質 | ||
1.一種人臉識別模型的訓練方法,其特征在于,所述方法包括:
當待訓練的人臉識別模型不滿足收斂條件時,將所述待訓練的人臉識別模型的第一個基本單元作為當前基本單元,將當前用戶的人臉圖像輸入至所述當前基本單元;其中,所述人臉圖像包括:戴口罩的人臉圖像和不戴口罩的人臉圖像;
將所述當前基本單元輸出的圖像特征輸入至當前特征加強模塊,通過所述當前特征加強模塊對所述當前基本單元輸出的圖像特征進行加強處理,得到加強處理后的圖像特征;
將所述加強處理后的圖像特征輸入至所述當前基本單元的后面一個基本單元;將所述后面一個基本單元作為所述當前基本單元;重復執行上述操作,直到將所述當前基本單元輸出的圖像特征輸入至所述待訓練的人臉識別模型的最后一個基本單元;
使用所述最后一個基本單元輸出的圖像特征對所述待訓練的人臉識別模型進行訓練,將下一個用戶的人臉圖像作為所述當前用戶的人臉圖像,重復執行上述操作,直到所述待訓練的人臉識別模型滿足所述收斂條件。
2.根據權利要求1所述的方法,其特征在于,所述將所述當前基本單元輸出的圖像特征輸入至當前特征加強模塊,通過所述當前特征加強模塊對所述當前基本單元輸出的圖像特征進行加強處理,得到加強處理后的圖像特征,包括:
將所述當前基本單元輸出的圖像特征轉換為N個通道對應的圖像特征;其中,N為大于等于1的自然數;
通過所述當前特征加強模塊的各個通道對與其對應的圖像特征進行加強處理,得到所述當前特征加強模塊的各個通道輸出的圖像特征;
將所述當前特征加強模塊的各個通道輸出的圖像特征進行合并,得到合并后的圖像特征;將所述合并后的圖像特征作為所述加強處理后的圖像特征。
3.根據權利要求2所述的方法,其特征在于,所述通過所述當前特征加強模塊的各個通道對與其對應的圖像特征進行加強處理,得到所述當前特征加強模塊的各個通道輸出的圖像特征,包括:
將各個通道對應的圖像特征輸入至各個通道的邏輯回歸模塊,得到各個邏輯回歸模塊輸出的圖像特征;
將各個通道對應的圖像特征輸入至各個通道的通道注意力模塊,得到各個通道注意力模塊輸出的通道掩碼;
將各個邏輯回歸模塊輸出的圖像特征和與其對應的通道注意力模塊輸出的通道掩碼進行逐元素相乘,得到各個逐元素相乘后的圖像特征;將各個逐元素相乘后的圖像特征作為所述當前特征加強模塊的各個通道輸出的圖像特征。
4.根據權利要求3所述的方法,其特征在于,所述將各個通道對應的圖像特征輸入至各個通道的通道注意力模塊,得到各個通道注意力模塊輸出的通道掩碼,包括:
將各個通道對應的圖像特征輸入分別輸入至所述通道注意力模塊中的最大全局池和平均全局池,得到所述最大全局池輸出的圖像特征和所述平均全局池輸出的圖像特征;
將所述最大全局池輸出的圖像特征與所述平均全局池輸出的圖像特征分別輸入至多層感知機中,得到所述多層感知機輸出的圖像特征;
根據所述多層感知機輸出的圖像特征計算得到所述通道注意力模塊輸出的通道掩碼。
5.根據權利要求4所述的方法,其特征在于,所述最大全局池輸出的圖像特征的維度為:(2,C,1,1);所述平均全局池輸出的圖像特征的維度為:(2,C,1,1);所述多層感知機為兩層全連接網絡,包括:第一層全連接網絡和第二層全連接網絡;其中,所述第一層全連接網絡輸出的圖像特征的維度為:(1,C/4,1,1);所述第二層全連接網絡輸出的圖像特征的維度為:(1,C,1,1);其中,C表示所述人臉圖像的通道數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010592670.2/1.html,轉載請聲明來源鉆瓜專利網。





