[發明專利]評分卡模型訓練方法及裝置在審
| 申請號: | 202010572344.5 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111738456A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 郭豪;蔡準;孫悅;郭曉鵬 | 申請(專利權)人: | 北京芯盾時代科技有限公司 |
| 主分類號: | G06N20/20 | 分類號: | G06N20/20;G06Q40/02 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 周偉 |
| 地址: | 102300 北京市門頭*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評分 模型 訓練 方法 裝置 | ||
本申請公開了一種評分卡模型訓練方法及裝置。該方法包括:獲取多個歷史數據,及每個歷史數據對應的標簽信息;對每個歷史數據進行向量化,得到每個歷史數據對應的第一向量;將每個第一向量及對應的標簽信息輸入到Xgboost模型進行轉化訓練,得到每個歷史數據對應的第一學習信息;將每個第一向量、對應標簽信息及對應的第一學習信息輸入到WideDeep模型中進行轉化訓練,得到每歷史數據對應的指導概率值;將每個第一向量及對應的指導概率值輸入到邏輯回歸模型中,并結合半監督的學習技巧進行學習訓練,得到評分卡模型。
技術領域
本申請涉及模型訓練領域,尤其涉及評分卡模型訓練領域。
背景技術
目前在信貸場景中使用的信貸準入模型主要是評分卡模型,根據用戶在申請信貸時填入的個人信息,根據評分卡模型從評分卡中找出對應的信息分值,將這些分值進行累加,最終得出的評分就是申請用戶的總體信用評分。評分越高,說明申請用戶的信用越好;評分越低,說明申請用戶的信用越差。
目前使用的評分卡模型的底層數學原理是基于邏輯回歸機器學習算法轉換來的,使用有監督的算法從過去用戶提交申請的歷史數據以及是否違約的標簽訓練而來,由于邏輯回歸模型屬于線性模型,模型的表征能力有限,故基于此得到的評分卡模型準確性較低。
發明內容
有鑒于此,本發明實施例提供了評分卡模型訓練方法及裝置,可有效提升評分卡模型的準確性。
為了實現上述目的,在第一方面,本發明提供了一種評分卡模型訓練方法,所述方法包括:
獲取多個歷史數據,及每個歷史數據對應的標簽信息;
對每個歷史數據進行向量化,得到每個歷史數據對應的第一向量;
將每個第一向量及對應的標簽信息輸入到Xgboost模型進行轉化訓練,得到每個歷史數據對應的第一學習信息;
將每個第一向量、對應標簽信息及對應的第一學習信息輸入到WideDeep模型中進行轉化訓練,得到每歷史數據對應的指導概率值;
將每個第一向量及對應的指導概率值輸入到邏輯回歸模型中,并結合半監督的學習技巧進行學習訓練,得到評分卡模型。
在一實施方式中,所述將每個第一向量及對應的標簽信息輸入到Xgboost模型進行轉化訓練,得到每個歷史數據對應的第一學習信息,包括:
將(x1,y1)…(xn,yn)輸入到Xgboost模型中進行轉化訓練,得到
其中,xn為第n個歷史數據對應的第一向量;yn為第n個歷史數據對應的標簽信息;zn為第n個歷史數據對應的第一學習信息,n為正整數。
在一實施方式中,所述將每個第一向量、對應標簽信息及對應的第一學習信息輸入到WideDeep模型中進行轉化訓練,得到每歷史數據對應的指導概率值,包括:
將(x1,y1,z1)…(xn,yn,zn)輸入到WideDeep模型中,具體的轉換公式如下:
(pi0,pi1)=WideDeep(xi)=sigmoid(Fdeep(xi)+Fwide(xi)+zi);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京芯盾時代科技有限公司,未經北京芯盾時代科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010572344.5/2.html,轉載請聲明來源鉆瓜專利網。





