[發明專利]信用評估模型建立方法和裝置及信用評估方法和設備在審
| 申請號: | 202011541286.6 | 申請日: | 2020-12-23 |
| 公開(公告)號: | CN112651823A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 亢延哲;陳燎;崔潤邦;賈寧;鄧江 | 申請(專利權)人: | 天津大學;青島泛鈦客科技有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300072 天*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信用 評估 模型 建立 方法 裝置 設備 | ||
1.一種信用評估模型建立方法,其特征在于,包括:
獲取接受數據集和拒絕數據集;其中,所述接受數據集中的樣本數據均附有標簽,所述拒絕數據集中的樣本數據無標簽;
基于所述接受數據集,通過半監督學習對訓練集中無標簽的樣本數據進行拒絕推斷,推斷出無標簽的樣本數據的標簽并更新所述訓練集;
其中,更新前的所述訓練集中的樣本數據包括:所述接受數據集中附有標簽的樣本數據和所述拒絕數據集中無標簽的樣本數據;
基于更新后的訓練集對分類器進行訓練,構建得到相應的信用評估模型。
2.根據權利要求1所述的方法,其特征在于,基于所述接受數據集,通過半監督學習對訓練集中無標簽的樣本數據進行拒絕推斷之前,還包括:對所述接受數據集中的少數類樣本數據進行重采樣的步驟;
其中,所述少數類樣本數據指的是同類別標簽數量較少的樣本數據。
3.根據權利要求2所述的方法,其特征在于,對所述接受數據集中的少數類樣本數據進行重采樣時,采用ADASYN算法進行。
4.根據權利要求2所述的方法,其特征在于,對所述接受數據集中的少數類樣本數據進行重采樣,包括:
由所述接受數據集中提取出部分樣本數據作為預訓練集;
根據所述預訓練集中少數類樣本數據的數量和多數類樣本數據的數量,對所述預訓練集中的少數類數據進行重采樣,直至所述預訓練集中不同類別標簽的數據分布達到預設平衡度;
其中,所述多數類樣本數據指的是同類別標簽數量較多的數據。
5.根據權利要求4所述的方法,其特征在于,根據所述預訓練集中少數類樣本數據的數量和多數類樣本數據的數量,對所述預訓練集中的少數類數據進行重采樣,還包括:
根據所述少數類數量的數量和所述多數類數據的數量,確定所述預訓練集的不平衡度;
在所述不平衡度小于可容忍的不平衡度的最大值時,執行對所述預訓練集中的少數類數據進行重采樣的步驟。
6.根據權利要求1所述的方法,其特征在于,基于所述接受數據集,通過半監督學習對訓練集中無標簽的樣本數據進行拒絕推斷時,采用標簽傳播算法進行;
其中,采用標簽傳播算法對訓練集中無標簽的樣本數據進行拒絕推斷,包括:
創建節點為所述訓練集中所有樣本數據點的全連接圖,并定義任意兩個節點之間的傳播權重;
基于兩個節點間的傳播權重,以及預先定義的兩個節點間的概率轉移矩陣和標簽矩陣,將各節點的標簽傳播至其他節點。
7.根據權利要求6所述的方法,其特征在于,所述傳播權重為:
所述概率轉移矩陣為:
其中,wij為所述傳播權重,dij為所述全連接圖中節點i和節點j之間的距離,Tij為所述標簽從節點j跳到節點i的概率。
8.一種信用評估模型建立裝置,其特征在于,包括:數據獲取模塊、訓練集更新模塊和模型訓練模塊;
其中,所述數據獲取模塊,被配置為獲取接受數據集和拒絕數據集;其中,所述接受數據集中的樣本數據均附有標簽,所述拒絕數據集中的樣本數據無標簽;
所述訓練集更新模塊,被配置為基于所述接受數據集,通過半監督學習對訓練集中無標簽的樣本數據進行拒絕推斷,推斷出無標簽的樣本數據的標簽并更新所述訓練集;
其中,更新前的所述訓練集中的樣本數據包括:所述接受數據集中附有標簽的樣本數據和所述拒絕數據集中無標簽的樣本數據;
所述模型訓練模塊,被配置為基于更新后的訓練集對分類器進行訓練,構建得到相應的信用評估模型。
9.一種信用評估方法,其特征在于,基于權利要求1至7任一項所述的方法建立的信用評估模型進行信用評估,包括:
獲取當前待評估的客戶信息;
將所述客戶信息輸入至所述信用評估模型,由所述信用評估模型對所述客戶信息進行信用評估,得到相應的評估結果。
10.一種信用評估模型建立設備,其特征在于,包括:
處理器;
用于存儲處理器可執行指令的存儲器;
其中,所述處理器被配置為執行所述可執行指令時實現權利要求1至7中任意一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學;青島泛鈦客科技有限公司,未經天津大學;青島泛鈦客科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011541286.6/1.html,轉載請聲明來源鉆瓜專利網。





