[發明專利]一種互聯網信貸逾期預測方法、裝置、服務器和存儲介質在審
| 申請號: | 202010046917.0 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111222982A | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 李萍 | 申請(專利權)人: | 隨手(北京)信息技術有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06Q10/04 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100095 北京市海淀區高里*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 互聯網 信貸 逾期 預測 方法 裝置 服務器 存儲 介質 | ||
1.一種互聯網信貸逾期預測方法,其特征在于,包括:
獲取待評估用戶的當前用戶數據,所述當前用戶數據包括性別、年齡、工作年限、通話記錄、和/或歷史借貸行為;
使用所述當前用戶數據輸入預設的逾期預測模型進行預測,以得到所述待評估用戶的信貸逾期概率;
根據所述信貸逾期概率對待評估用戶進行信貸預期評估。
2.根據權利要求1所述的互聯網信貸逾期預測方法,其特征在于,所述逾期預測模型的生成方法包括:
獲取歷史用戶的樣本用戶數據,所述樣本用戶數據包括歷史用戶的性別、年齡、工作年限、通話記錄、和/或歷史借貸行為,所述樣本用戶數據還包括用戶標簽,所述用戶標簽記載所述歷史用戶出現信貸逾期或未出現信貸逾期;
將所述樣本用戶數據分為訓練集和測試集;
從所述訓練集中篩選出第一數據特征;
將所述訓練集通過GBDT模型學習得到第二數據特征;
將所述第一數據特征和第二數據特征合并生成第三數據特征,使用LR模型訓練所述第三數據特征,生成所述逾期預測模型。
3.根據權利要求2所述的互聯網信貸逾期預測方法,其特征在于,所述從所述訓練集中篩選出第一數據特征,包括:
對所述訓練集進行EDA數據分析,獲取所述訓練集的缺失值、異常值、眾數、平均值、第1中位數、第2中位數、第3中位數、標準差、最大值和最小值的分布狀態;
對所述訓練集依次執行數據處理和變量篩選,生成第一數據特征。
4.根據權利要求3所述的互聯網信貸逾期預測方法,其特征在于,所述對所述訓練集依次執行數據處理和變量篩選,生成第一數據特征,包括:
基于第一預設閾值,去掉所述訓練集中缺失率超過第一預設閾值的訓練集數據;
采用卡方分箱法,對去除缺失率過高的所述訓練集數據進行分箱操作;
將分箱操作后的所述訓練集數據的特征從非線性可分空間映射到近似線性可分空間內,生成待處理變量;
基于第二預設閾值,刪除所述待處理變量中iv值超出第二預設閾值的變量,同時,基于第三預設閾值,刪除所述待處理變量中VIF方差膨脹因子值超出第三預設閾值的變量,生成第一數據特征。
5.根據權利要求2所述的互聯網信貸逾期預測方法,其特征在于,所述將所述訓練集通過GBDT模型學習得到第二數據特征,包括:
所述GBDT模型使用決策樹模型作為學習器;
基于所述性別、年齡、工作年限、通話記錄、和/或歷史借貸行為生成對應的決策樹;
將所述用戶標簽中用戶信貸逾期記為維度1,用戶信貸未逾期記為維度0;
所述訓練集根據所述決策樹進行學習,生成多個葉子結點;
將所述多個葉子結點的維度取值生成所述第二數據特征。
6.根據權利要求2所述的互聯網信貸逾期預測方法,其特征在于,所述使用LR模型訓練所述第三數據特征,生成所述逾期預測模型之后,還包括:
使用所述測試集測試所述逾期預測模型;
基于預測效果調整所述逾期預測模型參數。
7.一種互聯網信貸逾期預測裝置,其特征在于,包括:
第一獲取模塊,用于獲取待評估用戶的當前用戶數據,所述當前用戶數據包括性別、年齡、工作年限、通話記錄、和/或歷史借貸行為;
預測模塊,用于使用所述當前用戶數據輸入預設的逾期預測模型進行預測,以得到所述待評估用戶的信貸逾期概率;
政策制定模塊,用于根據所述信貸逾期概率對待評估用戶進行信貸預期評估。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于隨手(北京)信息技術有限公司,未經隨手(北京)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010046917.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:高鎳正極材料及其制備方法和應用
- 下一篇:一種消毒供應中心用洗滌裝置





