[發明專利]基于不平衡數據處理的信貸風險評估方法與系統在審
| 申請號: | 202011565846.1 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112634022A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 何涇沙;張宇晗;朱娜斐;夏新宇;宜裕紫;潘世佳;靳姝婷 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06N20/00 |
| 代理公司: | 北京匯信合知識產權代理有限公司 11335 | 代理人: | 林聰源 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 不平衡 數據處理 信貸風險 評估 方法 系統 | ||
本發明公開了一種基于不平衡數據處理的信貸風險評估方法與系統,方法包括:在接收到用戶通過客戶端發起的申請信貸請求時,獲取用戶填寫的客戶信息;根據客戶信息,獲取用戶的信用數據中的特征變量;將特征變量輸入訓練完成的基于不平衡數據處理的信貸風險評估模型;根據信貸風險評估模型輸出的預測結果,判斷是否通過用戶的信貸請求,并將判斷結果返回至客戶端。通過本發明的技術方案,解決了信貸數據集不平衡類別分類的問題,避免出現對少數類樣本預測精度較差的情況,提升了信貸風險評估模型對違約客戶的識別準確度。
技術領域
本發明涉及風險評估技術領域,尤其涉及一種基于不平衡數據處理的信貸風險評估方法和一種基于不平衡數據處理的信貸風險評估系統。
背景技術
信貸風險評估方法,是根據客戶的信用屬性等數據進行特征處理,然后采用特定的方法對客戶進行信用評估,據此決定是否給予授信,從而識別和減少在金融交易中存在的風險。
在傳統的信貸風險評估方法中,特征處理部分往往依靠專家的知識和經驗為準,采用傳統客戶基本信息,結合一般性的統計方法進行較為主觀的判斷,對信貸風險評估能力較低,不能有效識別違約客戶。
現行的基于機器學習的信貸風險評估方法:根據客戶的信用屬性等數據,利用數據預處理方法對樣本數據進行數據清洗,將樣本數據轉換成可以建模的數據。然后,根據特征重要性進行特征選取,利用機器學習算法構建信貸風險評估分類器,對客戶進行信用評估。傳統分類問題基于兩種假設:(1)各類別間數目大致均等;(2)各種類別錯分的代價相同。但不平衡數據中的少數樣本發生的概率低于多數類樣本,且代價明顯高于多數類樣本,若采用傳統分類器的以提高總體分類精度為目標,容易造成少數類的分類錯誤。
其中,不平衡數據集指的是數據集各個類別的樣本數目相差巨大。以二分類問題為例,假設正類的樣本數量遠大于負類的樣本數量,這種情況下的數據稱為不平衡數據,在信貸數據集中,不平衡數據集往往表示違約數據集樣本個數遠遠小于未違約數據集樣本個數,而這種現象會導致機器學習分類效果下降,從而不能有效識別出違約客戶。
現行的基于機器學習的信貸風險評估方法忽略了數據集類別的不平衡特性,清洗后的不平衡類別數據集輸入到構建好的機器學習分類器中進行訓練,造成少數類樣本即違約客戶的識別程度低的結果。
發明內容
針對上述問題,本發明提供了一種基于不平衡數據處理的信貸風險評估方法與系統,通過數據挖掘和機器學習方法,基于不平衡數據處理方法對信貸客戶的不平衡類別數據進行均衡,訓練得到信貸風險評估模型,解決了信貸數據集不平衡類別分類的問題,避免出現對少數類樣本預測精度較差的情況,提升了信貸風險評估模型對違約客戶的識別準確度。
為實現上述目的,本發明提供了一種基于不平衡數據處理的信貸風險評估方法,包括:在接收到用戶通過客戶端發起的申請信貸請求時,獲取所述用戶填寫的客戶信息;根據所述客戶信息,獲取所述用戶的信用數據中的特征變量;將所述特征變量輸入訓練完成的基于不平衡數據處理的信貸風險評估模型;根據所述信貸風險評估模型輸出的預測結果,判斷是否通過所述用戶的信貸請求,并將判斷結果返回至所述客戶端。
在上述技術方案中,優選地,所述基于不平衡數據處理的信貸風險評估模型的訓練方法包括:獲取客戶信用數據樣本集,并對所述信用數據樣本集進行數據清洗;利用隨機森林方法對數據清洗后的所述信用數據樣本集進行特征篩選,獲得特征數據集;利用不平衡數據處理方法對所述特征數據集進行類別平衡,得到訓練數據集;基于邏輯回歸算法和xgboost機器學習算法構建集成分類器;將所述訓練數據集輸入所述集成分類器對訓練數據進行機器學習,在損失函數達到最小值時得到訓練完成的所述信貸風險評估模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011565846.1/2.html,轉載請聲明來源鉆瓜專利網。





