[發明專利]偽標簽生成模型訓練方法、裝置及偽標簽生成方法及裝置有效
| 申請號: | 201810098924.8 | 申請日: | 2018-01-31 |
| 公開(公告)號: | CN108197670B | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 孫源良;樊雨茂;劉萌 | 申請(專利權)人: | 國信優易數據股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 戈豐 |
| 地址: | 100000 北京市豐臺區南四環*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 生成 模型 訓練 方法 裝置 | ||
1.一種偽標簽的生成方法,其特征在于,該方法包括:
獲取帶有類別標簽的樣本分類信息、不帶類別標簽的第一目標分類信息以及帶有類別標簽的第二目標分類信息,其中,所述樣本分類信息至少包括樣本人臉圖像、樣本視頻以及樣本語言詞匯中的一種或多種,當所述樣本分類信息為樣本人臉圖像時,目標分類信息為目標人臉圖像,當所述樣本分類信息為樣本視頻時,目標分類信息為目標視頻,當所述樣本分類信息為樣本語言詞匯時,目標分類信息為目標語言詞匯,所述目標分類信息包括第一目標分類信息和第二目標分類信息;
使用第一輔助神經網絡對第一目標分類信息進行特征學習,獲取在第一輔助神經網絡中指定特征提取層的第一特征向量,并且使用第二輔助神經網絡對第二目標分類信息進行特征學習,獲取第二輔助神經網絡中指定特征提取層的第二特征向量;
根據所述第一特征向量以及第二特征向量計算第一域混淆損失;
通過以下步驟獲得所述第一域混淆損失:
將從第一輔助神經網絡的各個特征提取層提取的第一特征向量進行拼接,形成第一拼接向量,以及將從第二輔助神經網絡的各個特征提取層提取的第二特征向量進行拼接,形成第二拼接向量,根據第一拼接向量以及第二拼接向量,計算第一域混淆損失;
其中,第一拼接向量滿足下述公式:
其中,dl表示層號為l的特征提取層所提取的第一特征向量;α表示衰減因子,其中,衰減因子為大于零且小于1的數;i表示特征提取層的層數;σ為激活函數,用于將特征向量中的特征值歸一化;
其中,第二拼接向量滿足下述公式:
其中,dl′表示層號為l的特征提取層所提取的第一特征向量;α表示衰減因子,其中,衰減因子為大于零且小于1的數;i表示特征提取層的層數;σ為激活函數,用于將特征向量中的特征值歸一化;
使用目標神經網絡對所述樣本分類信息進行特征學習,獲取所述目標神經網絡中指定特征提取層提取的樣本特征向量;并將目標神經網絡輸出的樣本特征向量輸入至目標分類器得到第一分類結果;
根據所述第一特征向量和所述樣本特征向量計算第二域混淆損失;
所述指定特征提取層包括位于每個神經網絡末端預設數量的特征提取層;
所述根據所述第一特征向量和所述樣本特征向量計算第二域混淆損失,具體包括:
將從第一輔助神經網絡的各個指定特征提取層提取的所述第一特征向量進行拼接,形成第一拼接向量,以及將從目標神經網絡的各個指定特征提取層提取的所述樣本特征向量進行拼接,形成目標拼接向量;
根據所述第一拼接向量以及所述目標拼接向量,計算所述第二域混淆損失;
其中,所述第二域混淆損失滿足下述公式:
其中,Xs表示第一目標域數據的集合;xs表示第一目標域數據集合中的數據;Xt表示第二目標域數據的集合;xt表示第二目標域數據集合中的數據;E(·)表示期望;
根據所述第一域混淆損失對所述第一輔助神經網絡進行本輪訓練;以及根據所述第二域混淆損失,以及所述第一分類結果,對所述目標神經網絡進行本輪訓練;以及根據所述第一分類結果,對所述目標分類器進行本輪訓練;
經過對所述目標神經網絡和所述目標分類器進行多輪訓練,得到偽標簽生成模型;其中,多輪訓練,是指在每一輪的多次訓練中為第一輔助神經網絡、第二輔助神經網絡以及目標神經網絡所分別輸入的第一目標域數據、第二目標域數據以及源域數據是不變的;而在不同輪的訓練中,為第一輔助神經網絡、第二輔助神經網絡以及目標神經網絡所分別輸入的第一目標域數據、第二目標域數據以及源域數據是不同的;
獲取待分類信息;
將所述待分類信息輸入至所述偽標簽生成模型,得到所述待分類信息的分類結果;
將所述待分類信息的分類結果作為所述待分類信息的偽標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信優易數據股份有限公司,未經國信優易數據股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810098924.8/1.html,轉載請聲明來源鉆瓜專利網。





