[發明專利]基于CatBoost與受限玻爾茲曼機結合的用戶借貸違約預測方法在審
| 申請號: | 202110024644.4 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112700324A | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 張濤;張冰 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06N20/20;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 catboost 受限 玻爾茲曼機 結合 用戶 借貸 違約 預測 方法 | ||
本發明公開了基于CatBoost與受限玻爾茲曼機結合的用戶借貸違約預測方法,目標變量定義,選取建模的客戶數據,對所述金融機構自身的字段和所述第三方數據字段進行分類;數據預處理,處理不平衡的數據,利用測試集通過使用準確率、查準率、召回率、f1?度量和AUC值這5個評價指標上對所訓練的模型進行評估,基于建立的模型,對貸款用戶進行違約預測。本方法根據已有貸款客戶的基本信息數據、征信數據、行為數據等,預測一個新的借款人的違約概率,起到提前預警的作用,預估未來的壞賬比例,及時做好資金安對違約概率可能性較高的客戶給與更多的關注,以避免損失,減少監控與監測過程中的人工參與部分,利用自動化的方法提高放款審核的準確率和效率。
技術領域
本發明涉及互聯網金融風控技術領域,尤其是涉及一種基于CatBoost與受限玻爾茲曼機結合的用戶借貸違約預測方法。
背景技術
近年來,金融行業的借貸業務在中國發展十分迅速,然而法律層面的監管相對較弱,有一定的監管盲區。借貸行業的門檻較低,參與人群的質量有很大差異,因此,金融行業的借貸業務的風險水平較高。對于以信貸類服務為主要業務的互聯網金融借貸平臺,由于信息技術不完善,平臺無法有效把控資產端風險,借貸用戶違約現象不斷,用戶為了獲得企業的貸款,對自己的相關信息可能存在隱瞞、欺騙的風險,這樣不對稱的用戶信息會增加企業的信貸風險,可能會給企業造成一定的損失。通過對借貸用戶在網購、交易、社交等平臺的信譽及行為數據進行深入挖掘和分析,對將分散在不同場景分散化的局部信息進行加工融合,能夠使其成為完整的全局信息。利用以大數據為基礎,以機器學習方法為手段建立的違約預測模型,能夠將用戶的有效信息轉化為用戶的違約概率,能夠很好地解決借貸用戶與借貸平臺在交易過程中的存在的信息不對稱的問題。
目前,金融大數據使用了更多的第三方數據,主要包括多頭借貸行為、互聯網、網上購物、第三方支付、反欺詐等數據,極大豐富了信用評估的可用數據維度,這使得全方位有效地對用戶進行違約預測成為可能,但同時也對預測模型的特征處理性能提出了更高的要求。金融信貸機構特征集合普遍具有數量多、緯度高的特點,但用戶違約預測應關注的并不是數據規模本身,而是這些海量數據中有價值的特征,按照傳統的方式人工進行特征篩選已不能很好的適用當前的信貸場景,依托先進的機器學習、數據挖掘等技術,金融保險行業的信貸相關的數據無論是在規模還是在數據來源上都有了長足的進步發展。在對用戶進行違約預測的過程中,引入機器學習相關模型構造學習策略和模型體系,是對借貸用戶進行風險控制較為常見的手段。
最近幾年,很多學者針對用戶借貸違約提出了許多新的用戶借貸違約預測模型,這些模型大體上可以分為兩類:第一類是應用層次分析法、模糊綜合評價法等統計學方法建立的信用指標評價體系,并指定每個指標的主觀權重。第二類是使用線性的數據挖掘算法建立的風險評估模型,這些模型存在一些共性的問題:評估準確率低,究其原因是信用數據存在非線性結構。而可以處理非線性結構數據的二分類算法應用比較廣泛的有:支持向量機和BP神經網絡。但是金融貸款數據存在類不平衡的特點,例如拍拍貸平臺正常還款記錄大約是違約記錄的10 倍,對于這樣的風險數據,支持向量機模型的第一類錯誤誤判率較高,即把正常還款客戶判為違約客戶。BP神經網絡也存在同樣的問題,而且BP神經網絡模型只有訓練集和預測集的誤差相近時,模型才具有泛化能力。
因此,有必要設計一種準確率更高的用戶借貸違約預測模型。
發明內容
為了解決以上技術問題,本發明中提供了一種基于CatBoost與受限玻爾茲曼機結合的用戶借貸違約預測方法,旨在為數據集所對應的借貸平臺提供借款用戶的違約預測方法,根據已有貸款客戶的基本信息數據、征信數據、行為數據等,預測一個新的借款人的違約概率,可以起到提前預警的作用,預估未來的壞賬比例,及時做好資金安排,也可以對違約概率可能性較高的客戶給與更多的關注,及時發現問題,以避免損失,減少監控與監測過程中的人工參與部分,利用自動化的方法提高放款審核的準確率和效率。
為實現上述目的,本發明的技術方案如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110024644.4/2.html,轉載請聲明來源鉆瓜專利網。





