[發明專利]面向企業家族的小微企業信用評估模型構建方法及系統在審
| 申請號: | 201910700190.0 | 申請日: | 2019-07-31 |
| 公開(公告)號: | CN110400215A | 公開(公告)日: | 2019-11-01 |
| 發明(設計)人: | 沈林江;張笑笑 | 申請(專利權)人: | 浪潮軟件集團有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評估模型 企業信用評估 信用評估 子模型 模型構建 企業行為 樣本數據 訓練集 算法 評估 模型構建模塊 模型訓練模塊 數據采集模塊 參數網格 參數微調 劃分模塊 交叉驗證 模型優化 隨機森林 網格搜索 加權和 構建 優選 樣本 輸出 信用 | ||
1.面向企業家族的小微企業信用評估模型構建方法,其特征在于包括如下步驟:
獲取樣本數據,所述樣本數據包括多個特征指標及和多個信用分數據,所述多個特征指標為基于小微企業畫像特征提取的征信評估屬性,所述多個信用分數據來自運營商的和信分和互聯網平臺;
將上述樣本數據劃分為訓練集和評估集;
通過隨機森林方法構建評估模型,所述評估模型由企業主信用評估子模型和企業行為信用評估子模型組成,并設置影響權重,以企業主信用評估子模型和企業行為信用評估子模型信用分的加權和作為評估模型的評估輸出;
以訓練集為輸入,通過十折交叉驗證算法和參數網格優選算法對所述評估模型進行訓練,并采用正則化方法對十折交叉驗證算法和參數網格優選算法進行約束;
以評估集為輸入,通過網格搜索方法對所述初始評估模型進行參數微調,得到最終的評估模型。
2.根據權利要求1所述的面向企業家族的小微企業信用評估方法,其特征在于將上述樣本數據劃分為訓練集和評估集之前,對樣本數據進行預處理;
所述預處理包括如下步驟:
對樣本數據進行NULL值填充,填充指標為所述樣本數據的均值;
對樣本數據進行異常值處理,將差于閾值的樣本數據刪除,所述閾值通過指標斜率圖確定;
基于指標取值標準化公式對樣本數據進行歸一化處理,以便于將樣本數據限定于同一區間中,指標取值標準化公式為:
其中,x表示歸一化處理前的指標值,表示歸一化后的指標值,xmin表示當前指標值中的最小值,xmax表示當前指標值中的最大值。
3.根據權利要求2所述的面向企業家族的小微企業信用評估模型構建方法,其特征在于對樣本數據進行預處理后,對特征指標進行降維處理;
所述對特征指標進行降維處理包括如下步驟:
通過spark feature label分組方法對預處理后的樣本數據進行分組處理,將特征指標數據與信用分數據分離;
計算每個特征指標數據的重要性,并剔除重要性低的特征指標數據,所述特征指標數據重要性的計算公式為:
特征指標數據的重要性=∑(errOOB2-errOOB1)/Ntree
errOOB1為隨機森林袋外數據計算所得誤差,errOOB2為對袋外數據加入噪聲干擾所得誤差,Ntree為隨機森林算法中樹的棵數;
通過卡方檢驗公式計算特征指標數據的卡方值,基于置信度、卡方值和自由度選擇與信用分數據有顯著關系的指標特征數據,卡方檢驗公式為:
其中,X表示特征指標數據,observed表示觀察值,expected表示理論值。
4.根據權利要求1、2或3所述的面向企業家族的小微企業信用評估模型構建方法,其特征在于獲取樣本數據之前,構建樣本庫,通過對樣本庫進行畫像分析得到小微企業畫像特征;
所述構建樣本庫包括如下步驟:
采集運營商數據、互聯網數據和行業數據,并將上述運營商數據、互聯網數據和行業數據加載至數據共享平臺中,所述數據共享平臺為基于多數據源、松耦合、高異構原則構建的數據共享平臺;
將加載的所述數據以指定的清洗規則進行異常數據清洗,得到清洗后數據;
通過數據關聯方法將上述清洗后數據進行數據融合,將上述加載的數據整合至一張數據表中;
基于數據顆粒度,匯總上述融合后的數據,得到樣本庫。
5.根據權利要求4所述的面向企業家族的小微企業信用評估模型構建方法,其特征在于通過離線采集、實時采集、爬蟲及通過合作伙伴引入的方式采集運營商數據、互聯網數據和行業數據。
6.根據權利要求1、2或3所述的面向企業家族的小微企業信用評估模型構建方法,其特征在于所述多個特征指標包括但不限于身份信息、位置信息、社交信息、消費信息、信用歷史、行為信息、工商信息和行業信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件集團有限公司,未經浪潮軟件集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910700190.0/1.html,轉載請聲明來源鉆瓜專利網。





