[發(fā)明專利]評估模型解釋工具的方法和裝置在審
| 申請?zhí)枺?/td> | 202010113648.5 | 申請日: | 2020-02-24 |
| 公開(公告)號: | CN111340356A | 公開(公告)日: | 2020-06-26 |
| 發(fā)明(設(shè)計)人: | 方軍鵬;唐才智 | 申請(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06F11/36;G06N3/04;G06N3/08 |
| 代理公司: | 北京億騰知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11309 | 代理人: | 張靜娟;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 評估 模型 解釋 工具 方法 裝置 | ||
本說明書實施例提供了一種評估模型解釋工具的方法和裝置,所述方法包括:使用所述多個訓(xùn)練樣本訓(xùn)練第一模型,以獲取具有第一參數(shù)組的第一模型,所述第一模型為自解釋型模型;基于所述具有第一參數(shù)組的第一模型的自解釋,獲取所述多個特征的第一重要性排序;基于所述多個訓(xùn)練樣本和所述第一參數(shù)組,通過模型解釋工具獲取所述多個特征的第二重要性排序;確定所述第二重要性排序中的前n個特征相對于所述第一重要性排序中的前n個特征的第一查全率,以用于評估所述模型解釋工具。
技術(shù)領(lǐng)域
本說明書實施例涉及機器學(xué)習(xí)技術(shù)領(lǐng)域,更具體地,涉及一種評估模型解釋工具的方法和裝置。
背景技術(shù)
機器學(xué)習(xí)目前在各個領(lǐng)域都有著廣泛的應(yīng)用,如零售,技術(shù),醫(yī)療保健,科學(xué)等等。機器學(xué)習(xí)模型本質(zhì)上是用一個復(fù)雜的函數(shù)擬合數(shù)據(jù)和目標(biāo)之間的關(guān)系。機器學(xué)習(xí)模型與一些簡單的規(guī)則有著很大的差別,規(guī)則明確數(shù)據(jù)和目標(biāo)之間的關(guān)系,但是機器學(xué)習(xí)模型是一個黑盒只有輸入和輸出,不明白內(nèi)部的機制。在某些領(lǐng)域,特別是在金融領(lǐng)域,比如保險、銀行等,數(shù)據(jù)科學(xué)家們通常最終不得不使用更傳統(tǒng)更簡單的機器學(xué)習(xí)模型(線性模型或決策樹模型)。然而,這類簡單模型雖能提供一定的可解釋性,但是簡單的模型對于實現(xiàn)復(fù)雜的任務(wù)顯的力不從心,模型精度性能等方面必然不如更加復(fù)雜的深度模型。
例如,使用花唄付款用戶可以提前透支次月還款,這一功能類似信用卡,這意味著用戶存在套現(xiàn)的風(fēng)險,這類套現(xiàn)用戶相較正常用戶逾期還款的概率更高,對公司造成損失。為了減少風(fēng)險,對于這類套現(xiàn)交易的攔截是十分有必要的,或者對于小額貸款,審批不通過,那么應(yīng)該給用戶提供合理的解釋。但是考慮到金融場景比較敏感,對于使用的攔截模型的可解釋性要求必然很高。傳統(tǒng)的方法是使用一些簡單的模型比如線性模型樹模型,雖然能滿足對可解釋性的要求,但是相對于復(fù)雜的實際情況這類簡單模型精度性能并不能滿足業(yè)務(wù)需求,例如精度太低會攔截大量正常交易誤傷正常用戶這些損失也是不能承受的。
考慮到以上的問題,目前提出了多種模型無關(guān)的對模型進行解釋的工具,對業(yè)務(wù)場景實際應(yīng)用的黑盒模型做出合理的解釋,而且因為不會對模型進行改動,所以不會影響到模型的性能。目前,用于衡量模型解釋工具的方法包括先驗衡量方法、針對圖像分類模型的模型解釋工具的評估方法、針對文本分類模型的模型解釋工具的評估方法等等。然而,仍然沒有可同時適用于多種模型解釋工具的方法。
因此,需要一種更有效的評估模型解釋工具的方案。
發(fā)明內(nèi)容
本說明書實施例旨在提供一種更有效的評估模型解釋工具的方案,以解決現(xiàn)有技術(shù)中的不足。
為實現(xiàn)上述目的,本說明書一個方面提供一種評估模型解釋工具的方法,所述方法基于預(yù)先獲取的多個訓(xùn)練樣本進行,其中,每個所述訓(xùn)練樣本包括業(yè)務(wù)對象的多個特征的特征值,所述方法包括:
使用所述多個訓(xùn)練樣本訓(xùn)練第一模型,以獲取具有第一參數(shù)組的第一模型,所述第一模型為自解釋型模型;
基于所述具有第一參數(shù)組的第一模型的自解釋,獲取所述多個特征的第一重要性排序;
基于所述多個訓(xùn)練樣本和所述第一參數(shù)組,通過模型解釋工具獲取所述多個特征的第二重要性排序;
確定所述第二重要性排序中的前n個特征相對于所述第一重要性排序中的前n個特征的第一查全率,以用于評估所述模型解釋工具。
在一種實施方式中,所述第一模型為以下任一模型:線性回歸模型、邏輯回歸模型、支持向量機模型、樹模型、貝葉斯模型、KNN模型、具有限定網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型。
在一種實施方式中,所述第一參數(shù)組中包括的多個參數(shù)與所述多個特征分別對應(yīng),其中,基于所述具有第一參數(shù)組的第一模型的自解釋,獲取所述多個特征的第一重要性排序包括,基于所述第一參數(shù)組中各個參數(shù)的絕對值大小,獲取所述多個特征的第一重要性排序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010113648.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





