[發明專利]信用評估模型的訓練方法、信用評估方法以及裝置在審
| 申請號: | 201610236701.4 | 申請日: | 2016-04-15 |
| 公開(公告)號: | CN107301577A | 公開(公告)日: | 2017-10-27 |
| 發明(設計)人: | 杜瑋;李文鵬;余舟華;施興;王曉光;楊旭;張柯;程孟力;曾海峰 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 張大威 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信用 評估 模型 訓練 方法 以及 裝置 | ||
技術領域
本申請涉及數據評估領域,尤其涉及一種信用評估模型的訓練方法、使用該信用評估模型進行信用評估的方法以及裝置。
背景技術
目前,常用的傳統征信系統中大多使用評分卡來構建用戶的信用模型,評分卡實際上是一種二分類模型,構建該模型主要使用邏輯回歸Logistic Regression算法來實現。評分卡模型需要對變量進行預處理,由于制作評分的需要,評分卡模型會先將變量進行分段,然后再將變量基于目標進行編碼,在信用模型中常用的編碼方式是WOE(Weight Of Evidence),直觀上可以理解為變量取某個值時對目標的影響,可通過這種方法來提高線性模型的性能。
但是,目前存在的問題是:傳統征信系統中,使用純線性模型雖然能夠保證模型的可解釋性,但性能相對而言會差一些,并且,傳統的線性模型特征組合的方法效率較低,導致構建的用戶信用模型性能較低,從而導致通過這種模型對用戶的信用評估結果可能不準確。
發明內容
本申請的目的旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本申請的第一個目的在于提出一種信用評估模型的訓練方法。該方法通過非線性GBDT模型對訓練原始特征進行訓練以生成對應的訓練交叉組合特征,并通過訓練交叉組合特征對線性LR模型進行訓練以構建信用評估模型,使得該信用評估模型既具備非線性模型的高性能,又具備線性模型的可解釋性。
本申請的第二個目的在于提出一種信用評估的方法。
本申請的第三個目的在于提出一種信用評估模型的訓練裝置。
本申請的第四個目的在于提出一種信用評估的裝置。
為達上述目的,本申請第一方面實施例的信用評估模型的訓練方法,包括:獲取訓練用戶在業務系統中的訓練原始行為數據;提取所述訓練原始行為數據中的訓練原始特征;根據迭代決策樹GBDT模型對所述訓練原始特征進行特征組合以生成對應的訓練交叉組合 特征;根據所述訓練交叉組合特征對邏輯回歸Logistic Regression模型進行訓練以構建信用評估模型。
本申請實施例的信用評估模型的訓練方法,通過非線性GBDT模型對訓練原始特征進行訓練以生成對應的訓練交叉組合特征,并通過訓練交叉組合特征對線性LR模型進行訓練以構建信用評估模型,使得該信用評估模型既具備非線性模型的高性能,又具備線性模型的可解釋性。
為達上述目的,本申請第二方面實施例的使用本申請第一方面實施例所述的信用評估模型進行信用評估的方法,包括:獲取目標用戶在業務系統中的原始行為數據;提取所述原始行為數據中的原始特征;根據GBDT模型對所述原始特征進行特征組合以生成對應的交叉組合特征;根據所述信用評估模型對所述交叉組合特征進行預測以獲取所述目標用戶的信用信息。
本申請實施例的信用評估的方法,在對目標用戶進行信用評估預測時,可先獲取該目標用戶在業務系統中的原始行為數據,并提取原始行為數據中的原始特征,之后,將原始特征通過GBDT的樹模型進行訓練以得到對應的交叉組合特征,最后,將該交叉組合特征放到信用評估模型中進行預測,得出該目標用戶的用戶信息,即通過使用既具備較高的可解釋性又具備高性能的信用評估模型對目標用戶進行信用評估,使得評估結果更加可靠、效果更佳,提高了評估結果的準確性。
為達上述目的,本申請第三方面實施例的信用評估模型的訓練裝置,包括:獲取模塊,用于獲取訓練用戶在業務系統中的訓練原始行為數據;提取模塊,用于提取所述訓練原始行為數據中的訓練原始特征;生成模塊,用于根據迭代決策樹GBDT模型對所述訓練原始特征進行特征組合以生成對應的訓練交叉組合特征;訓練模塊,用于根據所述訓練交叉組合特征對邏輯回歸Logistic Regression模型進行訓練以構建信用評估模型。
本申請實施例的信用評估模型的訓練裝置,通過非線性GBDT模型對訓練原始特征進行訓練以構建對應的訓練交叉組合特征,并通過訓練交叉組合特征對線性LR模型進行訓練以構建信用評估模型,使得該信用評估模型既具備非線性模型的高性能,又具備線性模型的可解釋性。
為達上述目的,本申請第四方面實施例的使用本申請第三方面實施例所述的信用評估模型進行信用評估的裝置,包括:獲取模塊,用于獲取目標用戶在業務系統中的原始行為數據;提取模塊,用于提取所述原始行為數據中的原始特征;生成模塊,用于根據GBDT模型對所述原始特征進行特征組合以生成對應的交叉組合特征;預測模塊,用于根據所述信用評估模型對所述交叉組合特征進行預測以獲取所述目標用戶的信用信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610236701.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種訂單信息的處理方法及系統
- 下一篇:獲取以及識別客戶信息的方法及其裝置





