[發(fā)明專利]分類模型訓(xùn)練方法、裝置及分類方法及裝置有效
| 申請?zhí)枺?/td> | 201810098964.2 | 申請日: | 2018-01-31 |
| 公開(公告)號: | CN108304876B | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計)人: | 孫源良;樊雨茂;劉萌 | 申請(專利權(quán))人: | 國信優(yōu)易數(shù)據(jù)股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/02 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 王術(shù)蘭 |
| 地址: | 100000 北京市豐臺區(qū)南四環(huán)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類 模型 訓(xùn)練 方法 裝置 | ||
本發(fā)明提供了一種分類模型訓(xùn)練方法、裝置以及分類方法及裝置,其中,該分類模型訓(xùn)練方法包括:使用第一神經(jīng)網(wǎng)絡(luò)對源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)進行共有特征捕捉,使第一目標(biāo)域特征向量學(xué)習(xí)源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的共有特征;使用第二神經(jīng)網(wǎng)絡(luò)對源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)進行差異性特征捕捉,使第二目標(biāo)域特征向量學(xué)習(xí)源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的差異特征;分別對第一目標(biāo)域特征向量以及第二目標(biāo)域特征向量進行聚類;根據(jù)聚類的結(jié)果及第一分類結(jié)果,對第一神經(jīng)網(wǎng)絡(luò)以及第一分類器進行本輪訓(xùn)練。該方法既能夠?qū)⒃从蚝湍繕?biāo)域之間的相同特征利用起來,也能夠?qū)⒃从蚝湍繕?biāo)域之間的差異特征進行利用,訓(xùn)練所得的分類模型能夠獲得更加準(zhǔn)確的分類結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)技術(shù)領(lǐng)域,具體而言,涉及一種分類模型訓(xùn)練方法、裝置以及分類方法及裝置。
背景技術(shù)
遷移學(xué)習(xí)可以利用已知領(lǐng)域中有標(biāo)簽的訓(xùn)練樣本(可稱為源域數(shù)據(jù))訓(xùn)練分類模型來對目標(biāo)領(lǐng)域的數(shù)據(jù)(可稱為目標(biāo)域數(shù)據(jù))進行標(biāo)定,而并不要求源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)具有相同的數(shù)據(jù)分布。遷移學(xué)習(xí)實際上是通過找尋待標(biāo)定數(shù)據(jù)和已知標(biāo)簽數(shù)據(jù)之間的聯(lián)系,例如采用核函數(shù)的方式將源域和目標(biāo)域數(shù)據(jù)映射到同一空間中,在該空間下源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)擁有相同的分布,從而可以利用該空間表示的有標(biāo)簽的源域樣本數(shù)據(jù)訓(xùn)練分類器來對目標(biāo)領(lǐng)域進行標(biāo)定。
已有的遷移學(xué)習(xí)方法中,通常使用源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)訓(xùn)練同一神經(jīng)網(wǎng)絡(luò),獲得參數(shù)共享網(wǎng)絡(luò)。該網(wǎng)絡(luò)訓(xùn)練過程能夠找出源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)之間的共性,通常將源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)映射在具有高可比性的高位空間,從而得到兩個域的分布特征。這種訓(xùn)練方法雖然能夠?qū)⒃从驍?shù)據(jù)和目標(biāo)域數(shù)據(jù)之間的相同特征利用起來,卻使源域和目標(biāo)域之間的差異特征丟失嚴(yán)重,導(dǎo)致訓(xùn)練得到的分類模型在對目標(biāo)域數(shù)據(jù)進行分類時存在一定的誤差。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例的目的在于提供一種分類模型訓(xùn)練方法、裝置及分類方法及裝置,既能夠?qū)⒃从蚝湍繕?biāo)域之間的相同特征利用起來,也能夠?qū)⒃从蚝湍繕?biāo)域之間的差異特征進行利用,訓(xùn)練所得的分類模型能夠獲得更加準(zhǔn)確的分類結(jié)果。
第一方面,本發(fā)明實施例提供了一種分類模型訓(xùn)練方法,該方法包括:
獲取攜帶標(biāo)簽的源域數(shù)據(jù)以及未攜帶標(biāo)簽的目標(biāo)域數(shù)據(jù);
將所述源域數(shù)據(jù)以及所述目標(biāo)域數(shù)據(jù)輸入第一神經(jīng)網(wǎng)絡(luò),為所述源域數(shù)據(jù)提取第一源域特征向量,為所述目標(biāo)域數(shù)據(jù)提取第一目標(biāo)域特征向量;并
對所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)進行共有特征捕捉,使所述第一目標(biāo)域特征向量學(xué)習(xí)所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)的共有特征;并
將所述第一源域特征向量輸入第一分類器得到第一分類結(jié)果;
將所述源域數(shù)據(jù)以及所述目標(biāo)域數(shù)據(jù)輸入第二神經(jīng)網(wǎng)絡(luò),為所述目標(biāo)域數(shù)據(jù)提取第二目標(biāo)域特征向量;并
對所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)進行差異性特征捕捉,使所述第二目標(biāo)域特征向量學(xué)習(xí)所述源域數(shù)據(jù)和所述目標(biāo)域數(shù)據(jù)的差異特征;
分別對所述第一目標(biāo)域特征向量以及所述第二目標(biāo)域特征向量進行聚類;
根據(jù)聚類的結(jié)果,以及所述第一分類結(jié)果,對所述第一神經(jīng)網(wǎng)絡(luò)以及所述第一分類器進行本輪訓(xùn)練;
經(jīng)過對所述第一神經(jīng)網(wǎng)絡(luò)和所述第一分類器進行多輪訓(xùn)練,得到分類模型。
第二方面,本發(fā)明實施例還提供一種分類方法,該方法包括:
獲取待分類數(shù)據(jù);
將所述待分類數(shù)據(jù)輸入至通過本申請實施例提供的分類模型訓(xùn)練方法得到的分類模型中,得到所述待分類數(shù)據(jù)的分類結(jié)果;
其中,所述分類模型包括:所述第一神經(jīng)網(wǎng)絡(luò)和所述第一分類器。
第二方面,本發(fā)明實施例還提供一種分類模型訓(xùn)練裝置,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國信優(yōu)易數(shù)據(jù)股份有限公司,未經(jīng)國信優(yōu)易數(shù)據(jù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810098964.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





