[發明專利]信用評估模型建立方法和裝置及信用評估方法和設備在審
| 申請號: | 202011541286.6 | 申請日: | 2020-12-23 |
| 公開(公告)號: | CN112651823A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 亢延哲;陳燎;崔潤邦;賈寧;鄧江 | 申請(專利權)人: | 天津大學;青島泛鈦客科技有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300072 天*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信用 評估 模型 建立 方法 裝置 設備 | ||
本申請涉及一種信用評估模型建立方法,包括:獲取接受數據集和拒絕數據集;基于接受數據集,通過半監督學習對訓練集中無標簽的樣本數據進行拒絕推斷,推斷出無標簽的樣本數據的標簽并更新訓練集;其中,更新前的訓練集中的樣本數據包括:接受數據集中附有標簽的樣本數據和拒絕數據集中無標簽的樣本數據;基于更新后的訓練集對分類器進行訓練,構建得到相應的信用評估模型。由此,在進行分類器的訓練時所采用的訓練集中的各樣本數據不僅包括有接受數據集中附有標簽的各樣本數據,同時還包括有拒絕數據集中無標簽的樣本數據,這也就極大地豐富了樣本數據,最終使得訓練得到的信用評估模型的檢測結果更加準確。
技術領域
本申請涉及電子商務中信用風險評估技術領域,尤其涉及一種信用評估模型建立方法和裝置及信用評估方法和設備。
背景技術
隨著電子商務和信息管理技術的飛速發展,我國消費金融行業在線上信貸市場取得了巨大成功。面對數以億計的貸款需求,如果消費金融公司無法將信貸風險控制在合理范圍內,則無法維持長期盈利。信用評分(Credit Scoring)是一種非常高效的信用風險評估工具,長期以來一直被認為是統計學和運籌學理論在銀行金融領域最成功的應用之一。在傳統的信用評分方法中,建模人員會根據申請者的還款表現將申請者分為“好客戶”與“壞客戶”,然后基于這樣的分類標準使用邏輯回歸(LR)模型學習歷史數據并用于新申請者還款表現的預測。同時,機器學習中的分類方法,如:神經網絡、支持向量機和決策樹等也已被廣泛用于信用風險評估。
但是,在傳統的信用評分方法中,貸款申請者的總體不僅包括被允許借款的申請者,還包括許多被拒絕借款的申請者,但這一部分申請者的信息并未被考慮進信用評分模型的建模過程中,這就使得貸款申請人總體的真實分布是未知的,被拒絕客戶的分布信息也未被考慮,這就會導致模型參數的估計出現偏差,從而影響最終所建立的信用評分模型進行信用評估時的精準度。
發明內容
有鑒于此,本申請提出了一種信用評估模型建立方法,可以有效提高所建立的信用評分模型的精準度。
根據本申請的一方面,提供了一種信用評估模型建立方法,包括:
獲取接受數據集和拒絕數據集;其中,所述接受數據集中的樣本數據均附有標簽,所述拒絕數據集中的樣本數據無標簽;
基于所述接受數據集,通過半監督學習對訓練集中無標簽的樣本數據進行拒絕推斷,推斷出無標簽的樣本數據的標簽并更新所述訓練集;
其中,更新前的所述訓練集中的樣本數據包括:所述接受數據集中附有標簽的樣本數據和所述拒絕數據集中無標簽的樣本數據;
基于更新后的訓練集對分類器進行訓練,構建得到相應的信用評估模型。
在一種可能的實現方式中,基于所述接受數據集,通過半監督學習對訓練集中無標簽的樣本數據進行拒絕推斷之前,還包括:對所述接受數據集中的少數類樣本數據進行重采樣的步驟;
其中,所述少數類樣本數據指的是同類別標簽數量較少的樣本數據。
在一種可能的實現方式中,對所述接受數據集中的少數類樣本數據進行重采樣時,采用ADASYN算法進行。
在一種可能的實現方式中,對所述接受數據集中的少數類樣本數據進行重采樣,包括:
由所述接受數據集中提取出部分樣本數據作為預訓練集;
根據所述預訓練集中少數類樣本數據的數量和多數類樣本數據的數量,對所述預訓練集中的少數類數據進行重采樣,直至所述預訓練集中不同類別標簽的數據分布達到預設平衡度;
其中,所述多數類樣本數據指的是同類別標簽數量較多的數據。
在一種可能的實現方式中,根據所述預訓練集中少數類樣本數據的數量和多數類樣本數據的數量,對所述預訓練集中的少數類數據進行重采樣,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學;青島泛鈦客科技有限公司,未經天津大學;青島泛鈦客科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011541286.6/2.html,轉載請聲明來源鉆瓜專利網。





