[發明專利]基于集成學習的互聯網金融風控預測方法在審
| 申請號: | 202210287645.2 | 申請日: | 2022-03-22 |
| 公開(公告)號: | CN114580782A | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 岳鈞;李開恒;王正寧;周釗聿;周樂瑤 | 申請(專利權)人: | 四川省自然資源科學研究院(四川省生產力促進中心) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/02;G06Q40/04;G06K9/62 |
| 代理公司: | 北京天奇智新知識產權代理有限公司 11340 | 代理人: | 許馳 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 集成 學習 互聯網 金融 預測 方法 | ||
1.基于集成學習的互聯網金融風控預測方法,其特征在于,包括:
S1、構建預測模型,預測模型包括第一層模型和第二層模型,第一層模型包括k個基礎模型,第二層模型包括一個基礎模型,第一層模型的輸出作為第二層模型的輸入;
S2、獲取數據集,并對數據集進行數據處理;
S3、處理后的數據集導入預測模型對其進行優化訓練,獲得最優預測模型;
S4、待預測數據導入到最優預測模型獲得風控預測結果。
2.根據權利要求1所述的基于集成學習的互聯網金融風控預測方法,其特征在于,在S1中,k不小于2,第一層模型的基礎模型各不相同。
3.根據權利要求1所述的基于集成學習的互聯網金融風控預測方法,其特征在于,在S2中進行數據處理包括:
S21、采用特殊空字符串處理、常量列清理、重復列清理、非法值替換和異常值清理對數據集進行分析處理;
S22、將分析處理后的數據集分為連續性數據和離散性數據;
S23、對離散性數據進行獨熱編碼(one-hot),對連續性數據進行歸一化處理,形成處理后的數據集D;
S24、將數據集D劃分為多份數據,數據的數量等于第一層模型中基礎模型的數量k。
4.根據權利要求3所述的基于集成學習的互聯網金融風控預測方法,其特征在于,在S3中包括:
S31、處理后的數據集導入第一層模型,獲得第一層模型中每個基礎模型的預測結果的集合表示為
S32、根據第一層模型中每個基礎模的預測結果的集合確定第一層模型的第一預測結果;
S33、計算第一層模型的誤差,基礎模型的損失函數為其中pi為基礎模型對第i條數據的預測結果,yi為第i條數據的真實標簽值,并以AUC(Area under the Curve of ROC)作為模型性能的衡量指標優化第一層模型的基礎模型;
S34、第一預測結果導入第二層模型進行訓練優化,獲得最優預測模型。
5.根據權利要求4所述的基于集成學習的互聯網金融風控預測方法,其特征在于,在S31中,將數據集D中的一份數據作為第一層模型的驗證數據,其余的k-1份數據作為第一層模型的訓練數據,對第一層模型共計完成k次訓練,并獲得第一層模型中每個基礎模型的預測結果的集合表示為其中fi為第一層模型中第i個基礎模型,每個基礎模型經過所有訓練數據完成訓練得到的預測結果集合記為其中為第k份訓練數據下的預測結果集合,AUC集合為Γi={αi1,αi2,αi3,...αik)其中αik為第k份訓練數據的AUC。
6.根據權利要求4所述的基于集成學習的互聯網金融風控預測方法,其特征在于,在S32中,將每個基礎模型fi訓練的預測結果進行集成得到第一層模型的第一預測結果表示為其αi表示基礎模型AUC的值,第一層模型完成訓練得到的第一預測結果集Dnew,表示為
7.根據權利要求4所述的基于集成學習的互聯網金融風控預測方法,其特征在于,在S33中,每個基礎模型的誤差為∈i,服從零均值方差為協方差的多維正態分布,所有基礎模型的平均預測所得誤差為最終的平方誤差的期望為
8.根據權利要求6所述的基于集成學習的互聯網金融風控預測方法,其特征在于,在S34中,第一預測結果集Dnew作為第二層模型fi的訓練數據進行訓練,訓練后輸出最終結果Ys=fi(Dnew)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川省自然資源科學研究院(四川省生產力促進中心),未經四川省自然資源科學研究院(四川省生產力促進中心)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210287645.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能紙巾機自適應網關
- 下一篇:一種園林綠化土方回填的施工方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





