[發明專利]一種基于改進分類組合的個人信貸信用風險預測方法在審
| 申請號: | 202110359366.8 | 申請日: | 2021-04-02 |
| 公開(公告)號: | CN113034268A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 吳東鵬;楊沛衡;徐典 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 南京千語知識產權代理事務所(普通合伙) 32394 | 代理人: | 尚于杰;祁文彥 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 分類 組合 個人 信貸 信用風險 預測 方法 | ||
1.一種基于改進分類組合的個人信貸信用風險預測方法,其特征在于,包括如下步驟:
步驟1:確定數據集,進行數據處理后,利用基于隨機森林的遞歸特征消除方法確定影響借款狀態的預測因子;
步驟2:將數據集中的數據進行均衡化處理;
步驟3:對經過均衡化處理后的數據進行組合分類,訓練各個分類器組成集成投票模型;
步驟4:進行違約率預測;將預測因子數據輸入基于改進組合分類的集成投票違約率預測模型中,輸出違約率結果。
2.如權利要求1所述的基于改進分類組合的個人信貸信用風險預測方法,其特征在于,所述步驟1包括:
步驟11:確定數據集;將真實交易的數據經過脫敏處理,將借款人資產狀況及現金流、借款期限及相關日期、銀行賬戶、征信查詢、信用評級作為數據集內容,其中目標數據標簽為“借款狀態”;
步驟12:將借款狀態中的“寬恕期中”、“已償清”界定為非逾期,記為0;將“逾期16~30天”、“逾期31~120天”、“違約”、“核銷”界定為逾期,記為1;
步驟13:剔除缺失值比例在55%以上的特征,隨后剔除同值性超過99%的特征、與逾期行為明顯無關的特征及離群值過多的特征,最后得到數據樣本;
步驟14:針對于fico_score和last_fico_score兩個特征,采用信貸違約預測中常見的處理方法,以fico評分的平均水平作為fico評級的代理變量,進行以下處理;
fico score=0.5×fico range low+0.5×fico range high;
last fico score=0.5×last fico range low+0.5×last fico range high;
步驟15:分別計算出各候選預測因子與借款狀態的相關系數;
相關系數的計算公式為:
式中,Xi為第i個樣本的預測因子值的大小,為預測因子的均值,Yi為第i個樣本的實測值大小,為實測值均值,M為樣本總數量;
步驟16:將剔除相關性大于0.9的特征直接剔除;
步驟17:采用基于遺傳算法的粗糙集約簡策略進行特征篩選,得到特征集,最后將上述特征用于基于隨機森林的遞歸式特征消除中再進一步進行特征篩選。
3.如權利要求2所述的基于改進分類組合的個人信貸信用風險預測方法,其特征在于,所述步驟17包括:
步驟171:將粗糙集約簡策略篩選完的特征作為初始特征集;
步驟172:采用隨機森林算法擬合具有當前特征集的數據,然后計算各個特征的重要性程度,并進行排名;
步驟173:刪除k個特征,更新當前特征集;
步驟174:跳轉到步驟172,直到特定數量的特征被保留下來,此時特征集包含所有重要性程度較高的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110359366.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:公路施工用路面噴淋養護設備及其使用方法
- 下一篇:一種電子物證保存用新型U盤





