[發(fā)明專(zhuān)利]一種模型效能的波動(dòng)識(shí)別方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202010169258.X | 申請(qǐng)日: | 2020-03-12 |
| 公開(kāi)(公告)號(hào): | CN111414945A | 公開(kāi)(公告)日: | 2020-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 紀(jì)忠光 | 申請(qǐng)(專(zhuān)利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06N20/00 |
| 代理公司: | 北京國(guó)昊天誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 張倩;朱文杰 |
| 地址: | 310000 浙江省杭州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 模型 效能 波動(dòng) 識(shí)別 方法 裝置 | ||
本說(shuō)明書(shū)一個(gè)或多個(gè)實(shí)施例提供了一種模型效能的波動(dòng)識(shí)別方法及裝置,該方法包括:獲取目標(biāo)模型的訓(xùn)練樣本數(shù)據(jù)和預(yù)測(cè)業(yè)務(wù)數(shù)據(jù);基于訓(xùn)練樣本數(shù)據(jù),對(duì)目標(biāo)模型進(jìn)行模型參數(shù)訓(xùn)練,確定各預(yù)設(shè)數(shù)據(jù)特征對(duì)目標(biāo)模型的重要性評(píng)價(jià)變量的變量數(shù)值;以及基于訓(xùn)練樣本數(shù)據(jù),對(duì)各預(yù)設(shè)數(shù)據(jù)特征的樣本標(biāo)簽區(qū)分能力進(jìn)行識(shí)別,確定預(yù)設(shè)數(shù)據(jù)特征對(duì)目標(biāo)模型的預(yù)測(cè)能力影響變量的變量數(shù)值;以及基于預(yù)測(cè)業(yè)務(wù)數(shù)據(jù)和訓(xùn)練樣本數(shù)據(jù),對(duì)各預(yù)測(cè)數(shù)據(jù)特征的特征分布差異進(jìn)行識(shí)別,確定各預(yù)設(shè)數(shù)據(jù)特征的穩(wěn)定性評(píng)價(jià)變量的變量數(shù)值;再根據(jù)確定出的各變量數(shù)值,確定目標(biāo)模型的模型效能波動(dòng)數(shù)據(jù)。
技術(shù)領(lǐng)域
本文件涉及大數(shù)據(jù)技術(shù)領(lǐng)域,尤其涉及一種模型效能的波動(dòng)識(shí)別方法及裝置。
背景技術(shù)
目前,隨著大數(shù)據(jù)、人工智能的快速發(fā)展,在大數(shù)據(jù)時(shí)代下,機(jī)器學(xué)習(xí)模型在業(yè)務(wù)中發(fā)揮著非常大的作用,其中,基于收集到的歷史樣本數(shù)據(jù)對(duì)模型參數(shù)進(jìn)行訓(xùn)練,得到訓(xùn)練好的機(jī)器學(xué)習(xí)模型;當(dāng)模型訓(xùn)練完畢后,將訓(xùn)練好的機(jī)器學(xué)習(xí)模型部署上線(xiàn),并利用訓(xùn)練好的機(jī)器學(xué)習(xí)模型對(duì)當(dāng)前收集的線(xiàn)上業(yè)務(wù)數(shù)據(jù)進(jìn)行預(yù)測(cè)。然而,由于機(jī)器學(xué)習(xí)模型一旦訓(xùn)練完畢,其模型參數(shù)便已經(jīng)固定,如果實(shí)際應(yīng)用中的線(xiàn)上業(yè)務(wù)數(shù)據(jù)或者業(yè)務(wù)場(chǎng)景發(fā)生變化,那么,可能對(duì)模型的應(yīng)用效果產(chǎn)生巨大的影響,因此,在實(shí)際業(yè)務(wù)中,模型效能監(jiān)控十分重要。
當(dāng)前,針對(duì)模型效能的監(jiān)控過(guò)程,通常在基于模型預(yù)測(cè)結(jié)果,獲得實(shí)際業(yè)務(wù)表現(xiàn)反饋數(shù)據(jù)之后,即經(jīng)過(guò)一段時(shí)間的實(shí)際業(yè)務(wù)表現(xiàn)數(shù)據(jù)收集之后,基于模型訓(xùn)練時(shí)模型指標(biāo)的特征值與基于實(shí)際業(yè)務(wù)表現(xiàn)反饋數(shù)據(jù)得到的模型指標(biāo)的特征值進(jìn)行比對(duì),來(lái)確定模型效能,例如,該模型指標(biāo)可以是分類(lèi)模型的評(píng)價(jià)指標(biāo)auc、ks等。其中,針對(duì)特定的模型應(yīng)用場(chǎng)景,模型的應(yīng)用效能需要比較長(zhǎng)的業(yè)務(wù)表現(xiàn)周期才能獲取到,例如,以信貸違約識(shí)別的應(yīng)用場(chǎng)景為例,先利用訓(xùn)練好的模型基于信貸申請(qǐng)用戶(hù)的線(xiàn)上業(yè)務(wù)數(shù)據(jù)進(jìn)行違約行為預(yù)測(cè),針對(duì)放行的信貸申請(qǐng)用戶(hù)還需要監(jiān)測(cè)其一段時(shí)間內(nèi)的履約行為數(shù)據(jù),才能確定該用戶(hù)是否存在違約行為,再基于該履約行為數(shù)據(jù)確定模型效能,然而,如果在此過(guò)程中,模型的效能大幅下滑,將產(chǎn)生一定程度的業(yè)務(wù)損失,且由于業(yè)務(wù)損失已發(fā)生則無(wú)法補(bǔ)救,因此,可能存在因模型效能的波動(dòng)導(dǎo)致不必要的業(yè)務(wù)損失。
由此可知,需要提供一種能夠更加快速、準(zhǔn)確地獲知模型效能波動(dòng)程度的技術(shù)方案。
發(fā)明內(nèi)容
本說(shuō)明書(shū)一個(gè)或多個(gè)實(shí)施例的目的是提供一種模型效能的波動(dòng)識(shí)別方法。該模型效能的波動(dòng)識(shí)別方法包括:
獲取目標(biāo)模型的訓(xùn)練樣本數(shù)據(jù)和預(yù)測(cè)業(yè)務(wù)數(shù)據(jù)。基于所述訓(xùn)練樣本數(shù)據(jù),對(duì)所述目標(biāo)模型進(jìn)行模型參數(shù)訓(xùn)練,確定各預(yù)設(shè)數(shù)據(jù)特征對(duì)所述目標(biāo)模型的重要性評(píng)價(jià)變量的變量數(shù)值。以及,基于所述訓(xùn)練樣本數(shù)據(jù),對(duì)各預(yù)設(shè)數(shù)據(jù)特征的樣本標(biāo)簽區(qū)分能力進(jìn)行識(shí)別,確定所述預(yù)設(shè)數(shù)據(jù)特征對(duì)所述目標(biāo)模型的預(yù)測(cè)能力影響變量的變量數(shù)值。以及,基于所述預(yù)測(cè)業(yè)務(wù)數(shù)據(jù)和所述訓(xùn)練樣本數(shù)據(jù),對(duì)各預(yù)測(cè)數(shù)據(jù)特征的特征分布差異進(jìn)行識(shí)別,確定各所述預(yù)設(shè)數(shù)據(jù)特征的穩(wěn)定性評(píng)價(jià)變量的變量數(shù)值。根據(jù)所述預(yù)測(cè)能力影響變量的變量數(shù)值、所述重要性評(píng)價(jià)變量的變量數(shù)值、以及所述穩(wěn)定性評(píng)價(jià)變量的變量數(shù)值,確定所述目標(biāo)模型的模型效能波動(dòng)數(shù)據(jù)。
本說(shuō)明書(shū)一個(gè)或多個(gè)實(shí)施例的目的是提供一種模型效能的波動(dòng)識(shí)別裝置。該模型效能的波動(dòng)識(shí)別裝置包括:
數(shù)據(jù)獲取模塊,其獲取目標(biāo)模型的訓(xùn)練樣本數(shù)據(jù)和預(yù)測(cè)業(yè)務(wù)數(shù)據(jù)。第一確定模塊,其基于所述訓(xùn)練樣本數(shù)據(jù),對(duì)所述目標(biāo)模型進(jìn)行模型參數(shù)訓(xùn)練,確定各預(yù)設(shè)數(shù)據(jù)特征對(duì)所述目標(biāo)模型的重要性評(píng)價(jià)變量的變量數(shù)值。第二確定模塊,其基于所述訓(xùn)練樣本數(shù)據(jù),對(duì)各預(yù)設(shè)數(shù)據(jù)特征的樣本標(biāo)簽區(qū)分能力進(jìn)行識(shí)別,確定所述預(yù)設(shè)數(shù)據(jù)特征對(duì)所述目標(biāo)模型的預(yù)測(cè)能力影響變量的變量數(shù)值。第三確定模塊,其基于所述預(yù)測(cè)業(yè)務(wù)數(shù)據(jù)和所述訓(xùn)練樣本數(shù)據(jù),對(duì)各預(yù)測(cè)數(shù)據(jù)特征的特征分布差異進(jìn)行識(shí)別,確定各所述預(yù)設(shè)數(shù)據(jù)特征的穩(wěn)定性評(píng)價(jià)變量的變量數(shù)值。效能波動(dòng)確定模塊,其根據(jù)所述預(yù)測(cè)能力影響變量的變量數(shù)值、所述重要性評(píng)價(jià)變量的變量數(shù)值、以及所述穩(wěn)定性評(píng)價(jià)變量的變量數(shù)值,確定所述目標(biāo)模型的模型效能波動(dòng)數(shù)據(jù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010169258.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 通過(guò)子系統(tǒng)效能基準(zhǔn)發(fā)生器進(jìn)行系統(tǒng)測(cè)試的方法
- 電子裝置、效能分類(lèi)系統(tǒng)與方法、電壓自動(dòng)校正系統(tǒng)
- 一種用于評(píng)估防護(hù)工程綜合防護(hù)效能的數(shù)學(xué)計(jì)算模型
- 一種磁場(chǎng)屏蔽效能預(yù)測(cè)方法及系統(tǒng)
- 裝備系統(tǒng)的作戰(zhàn)效能評(píng)估方法、裝置和存儲(chǔ)介質(zhì)
- 一種效能評(píng)估方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種基于PCM-TOPSIS法的導(dǎo)彈系統(tǒng)效能評(píng)估方法
- 公共資源交易效能評(píng)估方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)
- 基于多維度模型的算法效能評(píng)估方法
- 效能數(shù)據(jù)的處理方法、裝置及電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





