[發明專利]信用評分模型的構建方法、裝置、設備及存儲介質在審
| 申請號: | 201911331416.0 | 申請日: | 2019-12-21 |
| 公開(公告)號: | CN111080442A | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 牛坤;劉彥;張在美;謝國琪 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06N20/00 |
| 代理公司: | 長沙知行亦創知識產權代理事務所(普通合伙) 43240 | 代理人: | 嚴理佳 |
| 地址: | 410082 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信用 評分 模型 構建 方法 裝置 設備 存儲 介質 | ||
1.一種信用評分模型的構建方法,其特征在于,包括:
步驟1,將原始不平衡信用數據集劃分為訓練集和驗證集;所述原始不平衡信用數據集內的多個數據樣本包括多個用戶的信用信息,所述多個數據樣本與所述多個用戶一一對應;
步驟2,將所述訓練集內的數據樣本分為多數類訓練樣本和少數類訓練樣本;
步驟3,利用無監督聚類算法對所述多數類訓練樣本進行聚類,生成多個樣本簇;
步驟4,根據所述多個樣本簇和所述少數類訓練樣本,得到預設數量的平衡訓練子集;
步驟5,根據得到的平衡訓練子集、所述驗證集以及預設決策樹基分類器,構建信用評分模型。
2.根據權利要求1所述的構建方法,其特征在于,所述步驟1包括:
按照預設的數據劃分比例,將原始不平衡信用數據集劃分為訓練集和驗證集。
3.根據權利要求1所述的構建方法,其特征在于,所述步驟4包括:
步驟4.1,從所述多個樣本簇中的每個樣本簇中有放回的抽取Si個樣本,并將從所述多個樣本簇中提取到的所有樣本合并成一多數類訓練子集;
步驟4.2,從所述少數類訓練樣本中有放回的抽取Nmin個樣本;所述多數類訓練子集中的樣本數等于Nmin;
步驟4.3,將所述多數類訓練子集中的樣本和從所述少數類訓練樣本中抽取到的樣本合并成一平衡訓練子集;
步驟4.4,重復步驟4.1至步驟4.3,直至得到預設數量的平衡訓練子集。
4.根據權利要求1所述的構建方法,其特征在于,所述預設決策樹基分類器記錄于預先存儲的基分類器候選列表中,且所述預設決策樹基分類器的數量與所述平衡訓練子集的數量相同。
5.根據權利要求4所述的構建方法,其特征在于,所述步驟5包括:
步驟5.1,利用得到的預設數量的平衡訓練子集對預設數量的預設決策樹基分類器進行訓練,得到預設數量個訓練后的決策樹基分類器;
步驟5.2,根據所述驗證集內的數據樣本,從預設數量個訓練后的決策樹基分類器中篩選出目標決策樹基分類器;
步驟5.3,將所述目標決策樹基分類器作為信用評分模型。
6.根據權利要求5所述的構建方法,其特征在于,所述步驟5.1包括:
步驟5.11,建立所述預設數量的平衡訓練子集和所述預設數量的預設決策樹基分類器之間的一一對應關系;
步驟5.12,分別針對每個平衡訓練子集,利用該平衡訓練子集對該平衡訓練子集對應的預設決策樹基分類器進行訓練,得到預設數量個訓練后的決策樹基分類器。
7.根據權利要求5所述的構建方法,其特征在于,所述步驟5.2包括:
步驟5.21,分別針對每個訓練后的決策樹基分類器,將所述驗證集內的數據樣本輸入該決策樹基分類器,得到分類結果,并根據所述分類結果,獲取用于表征該決策樹基分類器的綜合性能的評價指標的數值;
步驟5.22,計算所有訓練后的決策樹基分類器的評價指標的數值的平均值;
步驟5.23,將預設數量個訓練后的決策樹基分類器中評價指標的數值大于或等于所述平均值的決策樹基分類器作為目標決策樹基分類器。
8.一種信用評分模型的構建裝置,其特征在于,包括:
第一劃分模塊,用于將原始不平衡信用數據集劃分為訓練集和驗證集;所述原始不平衡信用數據集內的多個數據樣本包括多個用戶的信用信息,所述多個數據樣本與所述多個用戶一一對應;
第二劃分模塊,用于將所述訓練集內的數據樣本分為多數類訓練樣本和少數類訓練樣本;
聚類模塊,用于利用無監督聚類算法對所述多數類訓練樣本進行聚類,生成多個樣本簇;
確定模塊,用于根據所述多個樣本簇和所述少數類訓練樣本,得到預設數量的平衡訓練子集;
構建模塊,用于根據得到的平衡訓練子集、所述驗證集以及預設決策樹基分類器,構建信用評分模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911331416.0/1.html,轉載請聲明來源鉆瓜專利網。





