[發(fā)明專利]一種分類模型訓(xùn)練方法及計算機設(shè)備在審
| 申請?zhí)枺?/td> | 202011637697.5 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112766320A | 公開(公告)日: | 2021-05-07 |
| 發(fā)明(設(shè)計)人: | 楊德杰 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳中一聯(lián)合知識產(chǎn)權(quán)代理有限公司 44414 | 代理人: | 肖遙 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 分類 模型 訓(xùn)練 方法 計算機 設(shè)備 | ||
本申請涉及模型訓(xùn)練技術(shù)領(lǐng)域,提供了一種分類模型訓(xùn)練方法、分類模型訓(xùn)練裝置、計算機設(shè)備及計算機可讀存儲介質(zhì)。其中,一種分類模型訓(xùn)練方法,從初始樣本集合中挖掘出正樣本集合,以及與正樣本集合對應(yīng)的候選樣本集合,由于候選樣本集合是基于正樣本集合從初始樣本集合中挖掘得到,因此候選樣本集合中的樣本是考慮了樣本的全局分布得到,并且利用預(yù)先構(gòu)建的生成式對抗網(wǎng)絡(luò),基于候選樣本集合與正樣本集合進行樣本訓(xùn)練,輸出的補充樣本集合不具有特征偏性,再將基于補充樣本集合與正樣本集合得到的目標(biāo)樣本集合,用于對預(yù)設(shè)分類模型進行訓(xùn)練,由于目標(biāo)訓(xùn)練樣本集合中因正負(fù)樣本均衡且無特征偏性,因此使得訓(xùn)練后的分類模型具有更好的魯棒性。
技術(shù)領(lǐng)域
本發(fā)明屬于涉及模型訓(xùn)練及區(qū)塊鏈技術(shù),尤其涉及一種分類模型訓(xùn)練方法、分類模型訓(xùn)練裝置、計算機設(shè)備及計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著人工智能技術(shù)的不斷發(fā)展,基于神經(jīng)網(wǎng)絡(luò)開發(fā)的機器學(xué)習(xí)模型也根據(jù)不同的需求在更新迭代。
然而,現(xiàn)有的分類模型在訓(xùn)練過程中,由于訓(xùn)練樣本不足,因此常常需要基于初始樣本進行樣本擴充,進而得到具有一定樣本數(shù)量的訓(xùn)練樣本。例如,當(dāng)初始樣本集合中的正樣本數(shù)量較少時,通過簡單復(fù)制正樣本的方式能夠快速提高初始樣本集合中的正樣本占比;或者,通過減少初始樣本集合中的負(fù)樣本占比,使得樣本集合中的正樣本占比提升。但是,無論是增加初始樣本集合中正樣本數(shù)量還是減少負(fù)樣本數(shù)量,都會導(dǎo)致所得訓(xùn)練樣本存在特征偏性,而利用該訓(xùn)練樣本對分類模型進行訓(xùn)練,則容易導(dǎo)致訓(xùn)練后的分類模型存在魯棒性較差的問題。
發(fā)明內(nèi)容
有鑒于此,本申請實施例提供了一種分類模型訓(xùn)練方法、分類模型訓(xùn)練裝置、計算機設(shè)備及計算機可讀存儲介質(zhì),以解決現(xiàn)有的分類模型訓(xùn)練方案中,存在訓(xùn)練后的分類模型存在魯棒性較差的問題。
本申請實施例的第一方面提供了一種分類模型訓(xùn)練方法,包括:
從初始樣本集合中挖掘出正樣本集合,以及與所述正樣本集合對應(yīng)的候選樣本集合;
利用預(yù)先構(gòu)建的生成式對抗網(wǎng)絡(luò),基于所述候選樣本集合與所述正樣本集合輸出補充樣本集合;
利用基于所述補充樣本集合與所述正樣本集合得到的目標(biāo)樣本集合,對預(yù)設(shè)分類模型進行訓(xùn)練,得到訓(xùn)練后的分類模型。
本申請實施例的第二方面提供了一種分類模型訓(xùn)練裝置,包括:
挖掘單元,用于從初始樣本集合中挖掘出正樣本集合,以及與所述正樣本集合對應(yīng)的候選樣本集合;
輸出單元,用于利用預(yù)先構(gòu)建的生成式對抗網(wǎng)絡(luò),基于所述候選樣本集合與所述正樣本集合輸出補充樣本集合;
訓(xùn)練單元,用于利用基于所述補充樣本集合與所述正樣本集合得到的目標(biāo)樣本集合,對預(yù)設(shè)分類模型進行訓(xùn)練,得到訓(xùn)練后的分類模型。
本申請實施例的第三方面提供了一種計算機設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)第一方面的各個步驟。
本申請實施例的第四方面提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)第一方面的各個步驟。
實施本申請實施例提供的一種分類模型訓(xùn)練方法、分類模型訓(xùn)練裝置、計算機設(shè)備及計算機可讀存儲介質(zhì)具有以下有益效果:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011637697.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





