[發明專利]分類模型訓練方法、裝置及分類方法及裝置有效
| 申請號: | 201810098964.2 | 申請日: | 2018-01-31 |
| 公開(公告)號: | CN108304876B | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 孫源良;樊雨茂;劉萌 | 申請(專利權)人: | 國信優易數據股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/02 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 王術蘭 |
| 地址: | 100000 北京市豐臺區南四環*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 模型 訓練 方法 裝置 | ||
1.一種分類模型訓練方法,其特征在于,該方法包括:
獲取攜帶標簽的源域數據以及未攜帶標簽的目標域數據,其中,所述源域數據包括樣本人臉圖像、樣本視頻以及樣本語言詞匯中的至少一種,當所述源域數據為樣本人臉圖像時,所述目標域數據為目標人臉圖像,當所述源域數據為樣本視頻時,所述目標域數據為目標視頻,當所述源域數據為樣本語言詞匯時,所述目標域數據為目標語言詞匯;
將所述源域數據以及所述目標域數據輸入第一神經網絡,提取所述源域數據的第一源域特征向量,以及提取所述目標域數據的第一目標域特征向量;并
對所述源域數據和所述目標域數據進行共有特征捕捉,使所述第一目標域特征向量學習所述源域數據和所述目標域數據的共有特征;并
將所述第一源域特征向量輸入第一分類器得到第一分類結果;
將所述源域數據以及所述目標域數據輸入第二神經網絡,提取所述目標域數據的第二目標域特征向量;并
對所述源域數據和所述目標域數據進行差異性特征捕捉,使所述第二目標域特征向量學習所述源域數據和所述目標域數據的差異特征;
分別對所述第一目標域特征向量以及所述第二目標域特征向量進行聚類;
根據聚類的結果,以及所述第一分類結果,對所述第一神經網絡以及所述第一分類器進行本輪訓練;
經過對所述第一神經網絡和所述第一分類器進行多輪訓練,得到分類模型;
采用如下方式對所述源域數據和所述目標域數據進行共有特征捕捉:
提取所述源域數據提取的第一源域特征向量,并在提取所述目標域數據提取的第一目標域特征向量之后,將所述第一源域特征向量和所述第一目標域特征向量進行梯度反向處理;
將進行梯度反向處理的第一源域特征向量和第一目標域特征向量輸入第一域分類器;
根據所述第一域分類器對第一源域特征向量以及第一目標域特征向量分別表征的所述源域數據和所述目標域數據的域分類結果,對所述第一神經網絡進行參數調整;
在所述將所述源域數據以及所述目標域數據輸入第二神經網絡,對所述源域數據以及所述目標域數據進行特征學習后,還包括:
為所述源域數據提取第二源域特征向量;
采用如下方式對所述源域數據和所述目標域數據進行差異性特征捕捉:
將所述第二源域特征向量和第二目標域特征向量輸入第二域分類器;
根據所述第二域分類器的對第二源域特征向量以及第二目標域特征向量分別表征的所述源域數據和所述目標域數據的域分類結果,對所述第二神經網絡進行參數調整;
其中,所述根據聚類的結果,以及所述的第一分類結果,對所述第一神經網絡以及所述第一分類器進行本輪訓練,具體包括:
根據對所述第一目標域特征向量進行聚類的結果,生成第一鄰接矩陣;
根據對所述第二目標域特征向量進行聚類的結果,生成第二鄰接矩陣;
根據所述第一鄰接矩陣以及第二鄰接矩陣之間的相似度,以及所述的第一分類結果,對所述第一神經網絡以及所述第一分類器進行本輪訓練;
所述根據所述第一鄰接矩陣以及第二鄰接矩陣之間的相似度,以及所述的第一分類結果,對所述第一神經網絡以及所述第一分類器進行本輪訓練,具體包括:
執行如下相似度計算操作以及分類操作,直至第一鄰接矩陣和第二鄰接矩陣之間的相似度小于預設的相似度閾值,以及得到的第一分類結果正確,則完成基于第二神經網絡對所述第一神經網絡和所述第一分類器的本輪訓練;
所述相似度計算操作包括:
計算當前得到的第一鄰接矩陣和第二鄰接矩陣之間的相似度;
針對相似度不小于預設的相似度閾值的情況,生成第一反饋信息,并基于所述第一反饋信息對所述第一神經網絡和所述第二神經網絡進行參數調整;
基于調整后的參數,使用第一神經網絡提取所述目標域數提取對應的新的第一目標域特征向量,以及使用第二神經網絡提取所述目標域數據對應的新的第二目標域特征向量;
對新的第一目標域特征向量進行聚類,生成新的第一鄰接矩陣,以及,對新的第二目標域特征向量進行聚類,生成新的第二鄰接矩陣,并再次執行所述相似度計算操作;
所述分類操作包括:
使用所述第一分類器對當前提取的所述第一源域特征向量進行分類;
針對分類結果錯誤的情況,生成第二反饋信息,并將于所述第二反饋信息,對所述第一神經網絡以及所述第一分類器的參數進行調整;
基于調整后的參數,使用第一神經網絡為所述源域數據提取新的第一源域特征向量,并再次執行所述分類操作;
獲取待分類數據;
將所述待分類數據輸入至所述分類模型中,得到所述待分類數據的分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信優易數據股份有限公司,未經國信優易數據股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810098964.2/1.html,轉載請聲明來源鉆瓜專利網。





