[發明專利]一種基于極限學習機的個人信用風險評估方法在審
| 申請號: | 201710219801.0 | 申請日: | 2017-04-06 |
| 公開(公告)號: | CN107025598A | 公開(公告)日: | 2017-08-08 |
| 發明(設計)人: | 丁世飛;王會元;王小玉 | 申請(專利權)人: | 中國礦業大學 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 221116 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 極限 學習機 個人 信用風險 評估 方法 | ||
技術領域
本發明涉及金融領域信用風險評估和機器學習領域,具體涉及一種基于極限學習機的個人信用風險評估方法及系統。
背景技術
信用風險評估是銀行風險管理的核心內容,世界銀行對全球銀行業危機的研究表明,導致銀行破產的最常見的原因就是信用風險。個人信用風險評估是商業銀行個人金融業務開展及信貸審批的關鍵環節,是個人信用風險管理的核心。對個人信用進行科學量化,建立起完善的個人信用評估體系及自動化的信用評估系統,是商業銀行提高經營效益的迫切需要。目前,個人信用風險評估的方法主要包括統計學方法和非統計學方法兩大類十幾種評估方法,統計學方法包括決策方法、邏輯回歸、線性回歸、非線性回歸等;非統計學方法包括線性規劃、整數規劃、神經網絡、遺傳算法、專家系統、分類樹、支持向量機等。
極限學習機是一種簡單易用、有效的單隱層前饋神經網絡SLFNs學習方法,近年來在機器學習領域取得了良好的發展。由于傳統的神經網絡學習算法(如BP算法)需要人為設置大量的網絡訓練參數,并且很容易產生局部最優解,而極限學習機只需要設置網絡的隱層節點個數,在算法執行過程中不需要調整網絡的輸入權值以及隱元的偏置,并且產生唯一的最優解,在回歸和分類的問題上,極限學習機算法表現出了很好的泛化能力以及較高的精度。在確保網絡具有良好的泛化性能的同時,極大地提升了訓練速度,同時避免了傳統神經網絡算法的局部極小、迭代次數過多、學習時間長等問題。
利用極限學習機對個人信用進行風險評估,由于其不需要人為設置訓練參數,只需要設置網絡的隱層節點個數,且隨機分配權值,因此既可以達到高精度,同時還可以減短分類時間。
發明內容
為了解決上述問題,本發明提出一種基于極限學習機的個人信用風險評估方法和系統,避免了傳統算法的局部極小、迭代次數過多、學習時間長以及人為設置大量網絡訓練參數等問題,只需要設置網絡的隱層節點個數,而且在算法的執行過程中不需要調整網絡輸入權值,明顯提高了分類的精度以及效率。
本發明是通過以下方案實現的:
本發明涉及一種基于極限學習機的個人信用風險評估方法,通過構建帶標簽的訓練集作為樣本集對極限學習機進行訓練,并將訓練好的極限學習機處理待分類的數據,最后根據極限學習機的輸出判斷識別結果進行比較得出結論。
本發明具體步驟如下:
步驟1,制作訓練集并將數據進行預處理:根據可能出現的各種違約情況,不同的違約原因,盡可能全面的詳細分析,制作有關個人信用數據的訓練集和標簽集,訓練集為經過預處理之后的數據樣本集合,首先將原始數據進行歸一化預處理為0-1之間的數據;
步驟2,構造極限學習機:極限學習機包括:輸入層、一個隱層、一個輸出層,其中:輸入層的數據是預處理之后的樣本數據集,假設樣本數據集有m個屬性,n條數據,那么它就是一個m*1階矩陣,輸入層就擁有m個節點,中間的隱層有L個節點,需要人為設置,輸出層就是分類之后的結果,假設分為T類,那么就有T個輸出節點,即就得到一個T*L矩陣輸出;
步驟3,訓練極限學習機,極限學習機的基本參數和規格設置完成后,每次選取固定個數的樣本輸入到極限學習機中,隨機初始化權重和偏置,具體過程如下:
步驟3.1:對極限學習機進行初始化,對輸入權值和偏置進行隨機初始化;
步驟3.2:將訓練樣本和標簽集導入初始化之后的極限學習機進行訓練,經過計算,最終得到實際輸出。
步驟3.3:將實際輸出與標簽進行對比分析,得到結果。
步驟3.4,個人信用數據分類,提取某個人的個人信用數據信息,進行歸一化處理之后,將其輸入到訓練好的極限學習機中,最終得到識別結果。
通過以上內容可知,本申請提供的是一種基于極限學習機的個人信用風險評估方法及系統,首先根據實際情況制作訓練集和標簽,然后設計極限學習機的輸入節點個數、隱含層節點個數和輸出節點個數等等,之后將訓練集輸入極限學習及中完成對極限學習機的訓練,最后輸入個人信用數據信息,預處理后輸入到極限學習機中,完成對數據的風險評估分類。本申請通過極限學習機對個人信用數據進行評估分類,避免了人為評估個人信用風險,直接以數據形式作為輸入,分類精度很高,而且可以反復被使用,處理效率高,訓練時間短。
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國礦業大學,未經中國礦業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710219801.0/2.html,轉載請聲明來源鉆瓜專利網。





