[發(fā)明專利]一種篩選機(jī)器學(xué)習(xí)模型的方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202010011960.3 | 申請(qǐng)日: | 2020-01-07 |
| 公開(公告)號(hào): | CN110807530A | 公開(公告)日: | 2020-02-18 |
| 發(fā)明(設(shè)計(jì))人: | 趙博譞 | 申請(qǐng)(專利權(quán))人: | 銀聯(lián)數(shù)據(jù)服務(wù)有限公司 |
| 主分類號(hào): | G06N20/00 | 分類號(hào): | G06N20/00 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 路曉丹 |
| 地址: | 201201 上海市浦*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 篩選 機(jī)器 學(xué)習(xí) 模型 方法 裝置 | ||
本發(fā)明實(shí)施例公開了一種篩選機(jī)器學(xué)習(xí)模型的方法及裝置,方法包括:通過(guò)第一數(shù)據(jù)集構(gòu)建多組第一使用集,針對(duì)每個(gè)待篩選模型,確定待篩選模型在每組第一使用集下的驗(yàn)證結(jié)果,根據(jù)各組第一使用集下的驗(yàn)證結(jié)果確定待篩選模型在第一數(shù)據(jù)集下的第一驗(yàn)證結(jié)果,根據(jù)各待篩選模型在第一數(shù)據(jù)集下的第一驗(yàn)證結(jié)果,將第一驗(yàn)證結(jié)果大于第一設(shè)定閾值的待篩選模型作為目標(biāo)模型。本發(fā)明通過(guò)利用歷史參數(shù)組合和其對(duì)應(yīng)的模型表現(xiàn)數(shù)值等歷史信息來(lái)探索更有可能提高模型表現(xiàn)能力的參數(shù)組合,模型篩選過(guò)程中無(wú)需遍歷所有可能的參數(shù)組合,提高了模型篩選的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,尤其涉及一種篩選機(jī)器學(xué)習(xí)模型的方法及裝置。
背景技術(shù)
如今機(jī)器學(xué)習(xí)模型根據(jù)模型復(fù)雜程度的不同,需要篩選的參數(shù)數(shù)量也不盡相同。簡(jiǎn)單如邏輯回歸,需要篩選的通常只有正則項(xiàng)系數(shù)C。機(jī)器學(xué)習(xí)模型與傳統(tǒng)模型相比,前者擁有大量的參數(shù),而這些參數(shù)決定了模型對(duì)于數(shù)據(jù)的學(xué)習(xí)能力。為了使機(jī)器學(xué)習(xí)模型更好地學(xué)習(xí)數(shù)據(jù)從而發(fā)揮其最大效力,需要從機(jī)器學(xué)習(xí)模型參數(shù)的可選取值空間中選取最優(yōu)的參數(shù)或參數(shù)組合,從而最終將其帶入模型中構(gòu)造最終用于預(yù)測(cè)的模型。參數(shù)越多,篩選的難度自然也越來(lái)越大,因?yàn)閰?shù)間排列組合的可能性越來(lái)越多。然而參數(shù)就好像是模型的閥門一樣,控制著模型的好壞,模型篩選的前提就是找到使得模型能夠得到最佳模型表現(xiàn)的最佳參數(shù),最后根據(jù)使用最佳參數(shù)的模型的最終表現(xiàn)確定最終用于預(yù)測(cè)的模型從而達(dá)到篩選模型的目的。
現(xiàn)有方案需要從用戶提供的參數(shù)選擇范圍內(nèi)生成備選參數(shù)組合,最佳參數(shù)需在用戶提供的參數(shù)選擇范圍內(nèi)方能更好地發(fā)揮模型篩選的能力,對(duì)操作者有一定的技術(shù)要求,同時(shí)還需要生成所有可能的參數(shù)組合,并計(jì)算每組參數(shù)組合所對(duì)應(yīng)的模型表現(xiàn),也即遍歷所有的參數(shù)組合可能性使得執(zhí)行效率低,此外,當(dāng)前技術(shù)中用于評(píng)估模型的驗(yàn)證數(shù)據(jù)由隨機(jī)抽取的方式生成,對(duì)輸出的模型評(píng)估結(jié)果注入了不確定性,將影響模型評(píng)估結(jié)果。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種篩選機(jī)器學(xué)習(xí)模型的方法及裝置,用以解決如何高效準(zhǔn)確的篩選模型的問(wèn)題。
第一方面,本發(fā)明實(shí)施例提供一種篩選機(jī)器學(xué)習(xí)模型的方法,包括:
通過(guò)第一數(shù)據(jù)集構(gòu)建多組第一使用集,其中,各組第一使用集對(duì)應(yīng)的驗(yàn)證集均不同且各組第一使用集對(duì)應(yīng)的訓(xùn)練集均不同;
針對(duì)每個(gè)待篩選模型,確定所述待篩選模型在每組第一使用集下的驗(yàn)證結(jié)果;根據(jù)各組第一使用集下的驗(yàn)證結(jié)果確定所述待篩選模型在所述第一數(shù)據(jù)集下的第一驗(yàn)證結(jié)果;其中,所述第一使用集下的驗(yàn)證結(jié)果是所述待篩選模型經(jīng)所述第一使用集下的訓(xùn)練集訓(xùn)練后使用所述第一使用集下的驗(yàn)證集驗(yàn)證的結(jié)果;
根據(jù)各待篩選模型在所述第一數(shù)據(jù)集下的第一驗(yàn)證結(jié)果,將第一驗(yàn)證結(jié)果大于第一設(shè)定閾值的待篩選模型作為目標(biāo)模型;
其中,所述確定所述待篩選模型在每組第一使用集下的驗(yàn)證結(jié)果,通過(guò)如下方式得到:
在第二數(shù)據(jù)集下按照所述待篩選模型的參數(shù)組中已訓(xùn)練的參數(shù)組和已訓(xùn)練的參數(shù)組的驗(yàn)證結(jié)果,從所述待篩選模型的參數(shù)組中尚未訓(xùn)練的參數(shù)組中確定下一訓(xùn)練使用的參數(shù)組,直至確定出所述待篩選模型在所述第二數(shù)據(jù)集下的第一目標(biāo)參數(shù)組;根據(jù)所述待篩選模型及所述第一目標(biāo)參數(shù)組,確定所述待篩選模型在所述第一使用集下的驗(yàn)證結(jié)果;所述第二數(shù)據(jù)集與所述第一數(shù)據(jù)集不同。
上述方案,通過(guò)利用歷史參數(shù)組合和其對(duì)應(yīng)的模型表現(xiàn)數(shù)值等歷史信息來(lái)探索更有可能提高模型表現(xiàn)能力的參數(shù)組合,模型篩選過(guò)程中無(wú)需遍歷所有可能的參數(shù)組合,提高了模型篩選的效率。
可選的,在所述將第一驗(yàn)證結(jié)果大于第一設(shè)定閾值的待篩選模型作為目標(biāo)模型之后,還包括:
根據(jù)所述目標(biāo)模型在所述第二數(shù)據(jù)集下的已訓(xùn)練的參數(shù)組,從所述目標(biāo)模型的參數(shù)組中確定出再訓(xùn)練的參數(shù)組;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于銀聯(lián)數(shù)據(jù)服務(wù)有限公司,未經(jīng)銀聯(lián)數(shù)據(jù)服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010011960.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





