[發明專利]一種企業信用風險預測方法在審
| 申請號: | 202111486678.1 | 申請日: | 2021-12-07 |
| 公開(公告)號: | CN114298819A | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 孫永鵬;王福政;高峰;羅成龍 | 申請(專利權)人: | 國久大數據股份有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06N7/00 |
| 代理公司: | 成都睿道專利代理事務所(普通合伙) 51217 | 代理人: | 廖敏 |
| 地址: | 646000 四川省瀘州市江陽區二*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 企業 信用風險 預測 方法 | ||
1.一種企業信用風險預測方法,其特征在于,包括如下步驟:
步驟1、采集樣本企業的多維度數據,構建白樣本庫和黑樣本庫;
步驟2、基于白樣本庫計算樣本企業信息透明度,并根據透明度閾值從白樣本庫和黑樣本庫中分別篩選得到大于閾值的樣本企業;
步驟3、將所述樣本企業輸入GBDT模型中進行訓練,得到n顆決策樹T并對T結果進行一位有效編碼,獲取所述樣本企業的特征編碼結果并進行組合得到風險特征;
步驟4、學習獲得的風險特征,構建風險預測模型進行風險概率預測。
2.如權利要求1所述的企業信用風險預測方法,其特征在于,所述方法還包括:
步驟5、獲取待預測目標的Cell單元,并從中獲取父關聯點集與待預測目標的屬性信息,所述Cell單元由關聯類型、待預測目標、標簽集合以及自然人與企業集合組成;
步驟6、從黑樣本庫內所有樣本企業的Cell單元中選取滿足預設條件的Cell,并從白樣本庫中查找得到所述屬性信息;
步驟7、基于所述滿足預設條件的Cell以及屬性信息建立貝葉斯概率模型,預測出父關聯節點的風險傳至待預測目標的概率,對步驟4中所有透明度小于透明度閾值的待預測目標風險概率預測結果進行更新。
3.如權利要求2所述的企業信用風險預測方法,其特征在于,步驟2中計算樣本企業信息透明度的公式如下:
上式中,transp表示透明度,N表示白樣本庫中特征的數量,featurei表示在白樣本庫中第i個特征,當不存在對應信息時,featurei設為Null,ωi表示featurei信息重要程度,當featurei為Null時,I取1,否則為0。
4.如權利要求3所述的企業信用風險預測方法,其特征在于,所述步驟3之前還包括:對白樣本和黑樣本進行降采樣。
5.如權利要求4所述的企業信用風險預測方法,其特征在于,所述步驟4中構建風險預測模型進行風險概率預測包括:
將風險特征輸入如下公式進行訓練,公式表示為:
上式中,X_GBDT表示風險特征,y表示預測的風險概率,β表示回歸系數。
6.如權利要求5所述的企業信用風險預測方法,其特征在于,所述步驟4還包括:
重復執行步驟3至4,將所得模型進行封裝,通過封裝所得模型進行風險概率預測,對預測結果取均值。
7.如權利要求6所述的企業信用風險預測方法,其特征在于,所述步驟5中的標簽集合的標簽類型為是否傳遞成功,當自然人與企業集合的立案時間早于待預測目標的立案時間且兩者均立案,則視為傳遞成功。
8.如權利要求7所述的企業信用風險預測方法,其特征在于,所述步驟6中的預設條件包括:目標透明度小于閾值、Cell中父關聯點集不為空、父關聯點透明度不小于閾值、父關聯點集與黑樣本庫存在交集。
9.如權利要求8所述的企業信用風險預測方法,其特征在于,所述步驟7中基于所述滿足預設條件的Cell以及屬性信息建立貝葉斯概率模型,模型結果如下:
上式中,Pi表示第i個父關聯節點的風險傳至待預測目標的概率,t表示第i個父關聯節點所屬企業類型,label表示傳遞成功,表示預測目標與第i個父關聯節點第j個屬性的實際值,ei表示預測目標與第i個父關聯節點的關聯類型,Pt(label=1)表示在t企業類型下,label為1的先驗概率,表示在t企業類型下,label為1的條件下Xj屬性的實際值為時的先驗概率。
10.如權利要求9所述的企業信用風險預測方法,其特征在于,所述步驟7中對步驟4中所有透明度小于透明度閾值的待預測目標風險概率預測結果進行更新,通過表達式表示為:
risk_score=f(p1*risk_score1,p2*risk_score2,...,pi*risk_scorei)
上式中,risk_scorei表示第i個父關聯節點的風險概率,如果第i個父關聯點不存在于黑樣本庫中且為企業,則步驟4的計算結果不變,如果第i個父關聯點存在于黑樣本庫中,則risk_scorei為1,否則為0,f(x1,x2,...,xn)表示待預測目標風險概率與父關聯節點風險概率的映射函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國久大數據股份有限公司,未經國久大數據股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111486678.1/1.html,轉載請聲明來源鉆瓜專利網。





