[發明專利]人臉識別模型訓練方法、人臉識別方法及裝置在審
| 申請號: | 202310922706.2 | 申請日: | 2023-07-26 |
| 公開(公告)號: | CN116665282A | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 溫東超;趙雅倩;史宏志;葛沅;崔星辰;張英杰 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/774;G06V10/82;G06N3/045;G06N3/0464;G06N3/0475;G06N3/094;G06N3/084 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 劉賀秋 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 模型 訓練 方法 裝置 | ||
1.一種人臉識別模型訓練方法,其特征在于,所述方法包括:
利用多個批次的源樣本對人臉識別模型進行訓練,并通過任一批次的所述源樣本迭代訓練所述人臉識別模型之后確定所述人臉識別模型的性能值;
判斷所述人臉識別模型的性能值是否大于預設性能閾值;
如果所述性能值大于所述預設性能閾值,在所述人臉識別模型的損失函數上增加正則項,以及使用多個批次的對抗樣本對所述人臉識別模型進行訓練;所述正則項基于所述源樣本、所述對抗樣本以及目標樣本確定,所述對抗樣本表示在所述源樣本基礎上添加過對抗擾動的樣本,所述目標樣本表示在所述源樣本基礎上構建的具有指定目標類別的樣本。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
如果所述性能值小于或者等于所述預設性能閾值,在所述人臉識別模型的損失函數上禁止所述正則項,并繼續利用所述源樣本對所述人臉識別模型進行訓練。
3.根據權利要求1或2所述的方法,其特征在于,所述判斷所述人臉識別模型的性能值是否大于預設性能閾值,包括:
判斷當前批次的源樣本的總體損失值是否小于預設精度閾值;其中,所述當前批次的源樣本為所述多個批次的源樣本中當前用于訓練所述人臉識別模型的一個批次的源樣本;
如果所述總體損失值小于所述預設精度閾值,確定所述人臉識別模型的性能值大于所述預設性能閾值;
如果所述總體損失值大于或者等于所述預設精度閾值,確定所述人臉識別模型的性能值不大于所述預設性能閾值。
4.根據權利要求3所述的方法,其特征在于,
所述多個批次的源樣本均為良性樣本;其中,所述良性樣本表示未添加過對抗擾動的真實樣本。
5.根據權利要求3所述的方法,其特征在于,
所述多個批次的源樣本中的任一個批次的源樣本包括從源集合中抽樣得到的樣本和從目標集合中抽樣得到的樣本,所述源集合和所述目標集合組成訓練集。
6.根據權利要求5所述的方法,其特征在于,
從所述源集合中抽樣得到的樣本的數量,與從所述目標集合中抽樣得到的樣本的數量相同。
7.根據權利要求3所述的方法,其特征在于,所述損失函數包括示性函數與所述正則項的乘積與第一結果的第一總和,所述第一結果為所述當前批次的源樣本的總體損失值的第一預設比例;
所述在所述人臉識別模型的損失函數上增加正則項,包括:
控制所述示性函數的返回值為1。
8.根據權利要求7所述的方法,其特征在于,所述在所述人臉識別模型的損失函數上禁止所述正則項,包括:
控制所述示性函數的返回值為0。
9.根據權利要求8所述的方法,其特征在于,
所述損失函數為所述第一總和與目標批次的對抗樣本的總體損失值的第二預設比例的第二總和,所述目標批次的對抗樣本為基于所述當前批次的源樣本形成的對抗樣本。
10.根據權利要求9所述的方法,其特征在于,
所述第一預設比例與所述第二預設比例的和為1。
11.根據權利要求9所述的方法,其特征在于,
所述當前批次的源樣本的總體損失值通過基于角度的第一損失函數確定;
所述目標批次的對抗樣本的總體損失值通過基于角度的第二損失函數確定。
12.根據權利要求3所述的方法,其特征在于,所述損失函數通過如下方式表示:
其中,表示在一個批次上所有樣本的總體損失值,表示在一個批次上良性樣本的總體損失值,表示在一個批次上對抗樣本的總體損失值,表示正則項,表示示性函數,表示預設精度閾值,用于控制示性函數的輸出值,表示超參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310922706.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于擴散模型的圖像增強方法、裝置、設備及存儲介質
- 下一篇:一種驅動電路





