[發明專利]多過濾器結合NSD指標的信貸客戶特征選擇方法和系統在審
| 申請號: | 201910124047.1 | 申請日: | 2019-02-19 |
| 公開(公告)號: | CN110111192A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 馮宏偉;李霜;田夢允;馮筠 | 申請(專利權)人: | 西北大學 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 西安恒泰知識產權代理事務所 61216 | 代理人: | 李鄭建 |
| 地址: | 710069 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信貸客戶 特征選擇 多個過濾器 特征子集 多過濾器 風險評估 排序矩陣 最優特征子集 評估和選擇 過濾器 評價指標 信貸 度量 搜索 評估 | ||
本發明公開了一種基于多過濾器結合NSD指標的信貸客戶特征選擇方法,首先用多個過濾器分別對信貸客戶的所有特征進行度量,構成特征排序矩陣;然后對特征排序矩陣進行搜索,產生多個候選的信貸客戶特征子集;最后用NSD評價指標對所有候選的信貸客戶特征子集進行評估,選出最優的適用于信貸風險評估的特征。本發明方法結合了多個過濾器式的特征選擇機制,實現了從多個角度共同對信貸客戶所有特征進行評估和選擇,解決了信貸客戶的最優特征子集選擇不合理的問題;相比于用單一過濾器進行特征選擇,多個過濾器結合選出的最優信貸客戶特征子集能有效提升信貸風險評估的精確率。
技術領域
本發明屬于金融業信用風險管理領域,涉及一種信貸風險評估中的信貸客戶特征選擇方法,具體涉及一種基于多過濾器結合NSD指標的信貸客戶特征選擇方法。
背景技術
隨著互聯網金融的快速發展,許多銀行機構和網絡借貸平臺暴露出越來越多的信用風險。信貸風險評估作為一種有效的工具,可以利用客戶的信息和客戶的活動數據來識別潛在的風險,在金融機構中發揮著越來越重要的作用。然而,由于信貸客戶數據海量且高維的特性,信貸風險評估模型的建立面臨著巨大的挑戰。一方面,海量的信貸客戶數據不斷涌現,直接使用原始數據對客戶進行信貸風險評估已變得十分困難。另一方面,信貸客戶數據中通常包含很多特征,究竟哪些特征更容易導致客戶發生違約,哪些特征在信貸風險評估中是無關且冗余的,這都是不容易被識別的。因此,采用特征選擇的方法對原始的信貸客戶數據進行分析,并從中選擇出更適用于信貸風險評估的信貸客戶特征是很有必要的。這將有利于信貸風險評估模型的建立,以提高金融機構對潛在違約客戶識別的精確率。
目前,信貸客戶特征選擇的方法主要分為兩大類:1)基于過濾器的特征選擇方法。這種方法通常采用某一統計學的度量,對每一維信貸客戶特征的重要程度進行計算,然后將所有信貸客戶特征按照度量的結果進行排序,最后選擇出排序靠前的幾維信貸客戶特征作為最優的特征子集。2)基于包裝器的特征方法。這種方法通常包括三個要素:搜索策略、評價函數和性能函數。首先,利用某一搜索策略搜索整個信貸客戶特征空間,產生多個候選的信貸客戶特征子集。然后,利用評價函數對所有候選的信貸客戶特征子集進行評估。通常,這種方法中的評價函數都設置為某一特定的分類器。經過對分類器不斷地訓練和測試,實現所有候選的信貸客戶特征子集的評估。最后,根據性能函數的表現,選擇出最優的信貸客戶特征子集。
盡管上述的兩種特征選擇算法都存在各自的特點。然而,在使用基于過濾器的方法對信貸客戶進行特征選擇時,只使用單一的過濾器對所有的信貸客戶特征進行度量,就只能從單一的視角去關注所有信貸客戶特征的重要程度,這就可能會忽略掉特征所包含的其他方面信息,導致最優信貸客戶特征子集的選擇不合理。此外,在使用基于包裝器的方法對信貸客戶數據進行特征選擇時,由于這種方法必須基于某一特定分類器的訓練和測試過程,才能實現對所有候選的信貸客戶特征子集的評估。因此,當海量且高維的信貸客戶數據用這種方法進行特征選擇時,所有候選的信貸客戶特征子集的評估過程會呈現出很大的計算開銷,并且隨著特征維數的增加,這種方法在實際信貸風險評估中并不適用。
發明內容
為解決現有技術中存在的不足,本發明提供了一種多過濾器結合NSD指標的信貸客戶特征選擇方法和系統,解決現有方法中單一過濾器進行特征選擇時,信貸客戶最優特征子集選擇不合理的問題,以及用包裝器對高維且海量的信貸客戶數據進行特征選擇時,計算開銷過大的問題。
為了解決上述技術問題,本發明采用如下技術方案予以實現:
本發明公開的多過濾器結合NSD指標的信貸客戶特征選擇方法,該方法用于對信貸客戶數據集中的信貸客戶特征進行選擇,其中,信貸客戶數據集中的信貸客戶的特征被標記有不同類型的標簽;該方法包括以下步驟:
步驟一:使用N個不同種類的過濾器分別對信貸客戶的M個特征的重要程度進行度量,獲得度量結果R:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北大學,未經西北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910124047.1/2.html,轉載請聲明來源鉆瓜專利網。





