[發明專利]基于GBST的金融違約風險預測方法、裝置和電子設備在審
| 申請號: | 201910582619.0 | 申請日: | 2019-06-29 |
| 公開(公告)號: | CN110348721A | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 沈赟;白苗君;鄭彥 | 申請(專利權)人: | 北京淇瑀信息科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q40/02;G06F16/2458;G06F17/18 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子設備 風險預測 生存曲線 預測 計算機可讀介質 訓練數據集 風險概率 金融用戶 生存概率 時間概率 時間維度 異構數據 真實標簽 初始化 生成樹 時間段 樹遍歷 殘差 迭代 金融 輸出 客戶 優化 | ||
本發明公開了一種基于GBST的金融違約風險預測方法、裝置、電子設備及計算機可讀介質。所述方法基于訓練數據集初始化GBST生存模型的基礎生存樹;從所述基礎生存樹開始,利用前一棵生存樹預測出的生存概率與真實標簽的殘差進行優化迭代,以此訓練得到后一棵生存樹,直到總體損失小于既定的閾值;對于新金融用戶的輸入數據,利用最后得到的生存樹遍歷生成樹的結果,輸出該用戶的生存曲線,根據該生存曲線預測每個時間段的違約風險概率。本發明擁有時間維度,可以獲得每個客戶的違約時間概率,預測精度高,且可以處理非線性異構數據。
技術領域
本發明涉及計算機信息處理領域,具體而言,涉及一種基于GBST的 金融違約風險預測方法、裝置、電子設備及計算機可讀介質。
背景技術
隨著互聯網的使用和大數據技術的發展,消費金融得到了長足發展。 然而,隨著越來越多的金融服務平臺的出現,對信用風險的管理提出了更 多的挑戰。為了有效的控制信用風險,發展出了許多不同的建模技術,包 括監督算法和無監督算法。在該領域信用評分模型是一種廣泛使用的風險 評估模型。
而生存分析模型最初源于處理死亡數據,在醫學、保險等領域有非常 廣泛的應用。如何將生存分析模型等具有時間維度的模型引入到信用風險 管理中以解決現有模型在時間維度上預測的缺乏,是本領域面臨的重要問 題。
發明內容
本發明旨在解決當前的信用評分模型對于金融用戶的評價和預測缺 少時間維度的缺陷。
為了解決上述技術問題,本發明第一方面提出一種基于GBST的金融 違約風險預測方法,包括:
獲取歷史金融用戶數據集,根據歷史金融用戶數據集建立訓練數據 集;
基于所述訓練數據集初始化GBST生存模型的基礎生存樹;
從所述基礎生存樹開始,利用前一棵生存樹預測出的生存概率與真 實標簽的殘差進行優化迭代,以此訓練得到后一棵生存樹,直到總體損 失小于既定的閾值;
對于新金融用戶的輸入數據,利用最后得到的生存樹遍歷生成樹的 結果,輸出該用戶的生存曲線,根據該生存曲線預測每個時間段的違約 風險概率。
根據本發明的優選實施方式,所述基于所述訓練數據集初始化 GBST生存模型的基礎生存樹包括:使用log-rank分離規則初始化生存 樹。
根據本發明的優選實施方式,所述使用log-rank分離規則初始化生 存樹包括:使用KM生成估計方法來估計生存樹節點中的生存函數。
根據本發明的優選實施方式,所述使用log-rank分離規則初始化生 存樹包括:使用COX模型來減小用戶特征的影響。
根據本發明的優選實施方式,所述利用前一棵生存樹預測出的生存 概率與真實標簽的殘差進行優化迭代包括:使用負二項對數似然函數作 為損失函數,通過最小化損失函數來優化迭代。
根據本發明的優選實施方式,所述利用前一棵生存樹預測出的生存 概率與真實標簽的殘差進行優化迭代包括:使用損失函數的負梯度替換 當前損失的近似值,然后擬合樹。
根據本發明的優選實施方式,所述利用前一棵生存樹預測出的生存 概率與真實標簽的殘差進行優化迭代包括:遍歷所有特征的所有有效值, 選擇合適的特征和值來最小化均方誤差。
本發明的第二方面提出一種基于GBST的金融違約風險預測裝置, 包括:
數據獲取模塊,用于獲取歷史金融用戶數據集,根據歷史金融用戶 數據集建立訓練數據集;
初始化模塊,用于基于所述訓練數據集初始化GBST生存模型的基 礎生存樹;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京淇瑀信息科技有限公司,未經北京淇瑀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910582619.0/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





