[發(fā)明專利]分類模型訓(xùn)練方法、裝置及分類方法及裝置有效
| 申請?zhí)枺?/td> | 201810098964.2 | 申請日: | 2018-01-31 |
| 公開(公告)號: | CN108304876B | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 孫源良;樊雨茂;劉萌 | 申請(專利權(quán))人: | 國信優(yōu)易數(shù)據(jù)股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/02 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 王術(shù)蘭 |
| 地址: | 100000 北京市豐臺區(qū)南四環(huán)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類 模型 訓(xùn)練 方法 裝置 | ||
1.一種分類模型訓(xùn)練方法,其特征在于,該方法包括:
獲取攜帶標(biāo)簽的源域數(shù)據(jù)以及未攜帶標(biāo)簽的目標(biāo)域數(shù)據(jù),其中,所述源域數(shù)據(jù)包括樣本人臉圖像、樣本視頻以及樣本語言詞匯中的至少一種,當(dāng)所述源域數(shù)據(jù)為樣本人臉圖像時(shí),所述目標(biāo)域數(shù)據(jù)為目標(biāo)人臉圖像,當(dāng)所述源域數(shù)據(jù)為樣本視頻時(shí),所述目標(biāo)域數(shù)據(jù)為目標(biāo)視頻,當(dāng)所述源域數(shù)據(jù)為樣本語言詞匯時(shí),所述目標(biāo)域數(shù)據(jù)為目標(biāo)語言詞匯;
將所述源域數(shù)據(jù)以及所述目標(biāo)域數(shù)據(jù)輸入第一神經(jīng)網(wǎng)絡(luò),提取所述源域數(shù)據(jù)的第一源域特征向量,以及提取所述目標(biāo)域數(shù)據(jù)的第一目標(biāo)域特征向量;并
對所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)進(jìn)行共有特征捕捉,使所述第一目標(biāo)域特征向量學(xué)習(xí)所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)的共有特征;并
將所述第一源域特征向量輸入第一分類器得到第一分類結(jié)果;
將所述源域數(shù)據(jù)以及所述目標(biāo)域數(shù)據(jù)輸入第二神經(jīng)網(wǎng)絡(luò),提取所述目標(biāo)域數(shù)據(jù)的第二目標(biāo)域特征向量;并
對所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)進(jìn)行差異性特征捕捉,使所述第二目標(biāo)域特征向量學(xué)習(xí)所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)的差異特征;
分別對所述第一目標(biāo)域特征向量以及所述第二目標(biāo)域特征向量進(jìn)行聚類;
根據(jù)聚類的結(jié)果,以及所述第一分類結(jié)果,對所述第一神經(jīng)網(wǎng)絡(luò)以及所述第一分類器進(jìn)行本輪訓(xùn)練;
經(jīng)過對所述第一神經(jīng)網(wǎng)絡(luò)和所述第一分類器進(jìn)行多輪訓(xùn)練,得到分類模型;
采用如下方式對所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)進(jìn)行共有特征捕捉:
提取所述源域數(shù)據(jù)提取的第一源域特征向量,并在提取所述目標(biāo)域數(shù)據(jù)提取的第一目標(biāo)域特征向量之后,將所述第一源域特征向量和所述第一目標(biāo)域特征向量進(jìn)行梯度反向處理;
將進(jìn)行梯度反向處理的第一源域特征向量和第一目標(biāo)域特征向量輸入第一域分類器;
根據(jù)所述第一域分類器對第一源域特征向量以及第一目標(biāo)域特征向量分別表征的所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)的域分類結(jié)果,對所述第一神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)調(diào)整;
在所述將所述源域數(shù)據(jù)以及所述目標(biāo)域數(shù)據(jù)輸入第二神經(jīng)網(wǎng)絡(luò),對所述源域數(shù)據(jù)以及所述目標(biāo)域數(shù)據(jù)進(jìn)行特征學(xué)習(xí)后,還包括:
為所述源域數(shù)據(jù)提取第二源域特征向量;
采用如下方式對所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)進(jìn)行差異性特征捕捉:
將所述第二源域特征向量和第二目標(biāo)域特征向量輸入第二域分類器;
根據(jù)所述第二域分類器的對第二源域特征向量以及第二目標(biāo)域特征向量分別表征的所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)的域分類結(jié)果,對所述第二神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)調(diào)整;
其中,所述根據(jù)聚類的結(jié)果,以及所述的第一分類結(jié)果,對所述第一神經(jīng)網(wǎng)絡(luò)以及所述第一分類器進(jìn)行本輪訓(xùn)練,具體包括:
根據(jù)對所述第一目標(biāo)域特征向量進(jìn)行聚類的結(jié)果,生成第一鄰接矩陣;
根據(jù)對所述第二目標(biāo)域特征向量進(jìn)行聚類的結(jié)果,生成第二鄰接矩陣;
根據(jù)所述第一鄰接矩陣以及第二鄰接矩陣之間的相似度,以及所述的第一分類結(jié)果,對所述第一神經(jīng)網(wǎng)絡(luò)以及所述第一分類器進(jìn)行本輪訓(xùn)練;
所述根據(jù)所述第一鄰接矩陣以及第二鄰接矩陣之間的相似度,以及所述的第一分類結(jié)果,對所述第一神經(jīng)網(wǎng)絡(luò)以及所述第一分類器進(jìn)行本輪訓(xùn)練,具體包括:
執(zhí)行如下相似度計(jì)算操作以及分類操作,直至第一鄰接矩陣和第二鄰接矩陣之間的相似度小于預(yù)設(shè)的相似度閾值,以及得到的第一分類結(jié)果正確,則完成基于第二神經(jīng)網(wǎng)絡(luò)對所述第一神經(jīng)網(wǎng)絡(luò)和所述第一分類器的本輪訓(xùn)練;
所述相似度計(jì)算操作包括:
計(jì)算當(dāng)前得到的第一鄰接矩陣和第二鄰接矩陣之間的相似度;
針對相似度不小于預(yù)設(shè)的相似度閾值的情況,生成第一反饋信息,并基于所述第一反饋信息對所述第一神經(jīng)網(wǎng)絡(luò)和所述第二神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)調(diào)整;
基于調(diào)整后的參數(shù),使用第一神經(jīng)網(wǎng)絡(luò)提取所述目標(biāo)域數(shù)提取對應(yīng)的新的第一目標(biāo)域特征向量,以及使用第二神經(jīng)網(wǎng)絡(luò)提取所述目標(biāo)域數(shù)據(jù)對應(yīng)的新的第二目標(biāo)域特征向量;
對新的第一目標(biāo)域特征向量進(jìn)行聚類,生成新的第一鄰接矩陣,以及,對新的第二目標(biāo)域特征向量進(jìn)行聚類,生成新的第二鄰接矩陣,并再次執(zhí)行所述相似度計(jì)算操作;
所述分類操作包括:
使用所述第一分類器對當(dāng)前提取的所述第一源域特征向量進(jìn)行分類;
針對分類結(jié)果錯(cuò)誤的情況,生成第二反饋信息,并將于所述第二反饋信息,對所述第一神經(jīng)網(wǎng)絡(luò)以及所述第一分類器的參數(shù)進(jìn)行調(diào)整;
基于調(diào)整后的參數(shù),使用第一神經(jīng)網(wǎng)絡(luò)為所述源域數(shù)據(jù)提取新的第一源域特征向量,并再次執(zhí)行所述分類操作;
獲取待分類數(shù)據(jù);
將所述待分類數(shù)據(jù)輸入至所述分類模型中,得到所述待分類數(shù)據(jù)的分類結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國信優(yōu)易數(shù)據(jù)股份有限公司,未經(jīng)國信優(yōu)易數(shù)據(jù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810098964.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





