[發明專利]多過濾器結合NSD指標的信貸客戶特征選擇方法和系統在審
| 申請號: | 201910124047.1 | 申請日: | 2019-02-19 |
| 公開(公告)號: | CN110111192A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 馮宏偉;李霜;田夢允;馮筠 | 申請(專利權)人: | 西北大學 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 西安恒泰知識產權代理事務所 61216 | 代理人: | 李鄭建 |
| 地址: | 710069 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信貸客戶 特征選擇 多個過濾器 特征子集 多過濾器 風險評估 排序矩陣 最優特征子集 評估和選擇 過濾器 評價指標 信貸 度量 搜索 評估 | ||
1.多過濾器結合NSD指標的信貸客戶特征選擇方法,該方法用于對信貸客戶數據集中的信貸客戶特征進行選擇,其中,信貸客戶數據集中的信貸客戶的特征被標記有不同類型的標簽;
其特征在于,該方法包括以下步驟:
步驟一:使用N個不同種類的過濾器分別對信貸客戶的M個特征的重要程度進行度量,獲得度量結果R:
步驟1.1:使用第n種過濾器對所有信貸客戶的第m個特征的重要程度進行度量,獲得度量結果n=1,2,...,N;m=1,2,...,M;N表示過濾器的個數,M表示特征的個數,N≥2,M≥1;
步驟1.2:依據上述步驟1.1,使用第n種過濾器對所有特征的重要程度進行度量,獲得度量結果
步驟1.3:依照上述步驟1.1至步驟1.2,使用所有不同種類的過濾器對所有特征的重要程度進行度量,獲得度量結果R;
步驟二:按照步驟1.3中度量結果的大小對每個度量結果對應的特征進行排序,構成信貸客戶的特征排序矩陣[P]m×n;
步驟三:對信貸客戶特征排序矩陣[P]m×n進行搜索,產生多個候選特征子集A1,A2,...,Ak,...,AK,其中,Ak表示信貸客戶的第k個候選特征子集,Ak=[ak1,...,aks,…,akS],aks表示第k個候選特征子集Ak中的第s個特征;K表示候選特征子集的個數;
步驟四:計算每一個候選特征子集的NSD值;
步驟4.1:根據信貸客戶數據集中不同類型的標簽將特征ak1,..,aks,…,akS建立為不同類別的樣本,然后將這些樣本合并為一個信貸客戶樣本空間Ok;
步驟4.2:通過下式(1)計算候選特征子集Ak的NSDk值;
其中,表示樣本空間Ok中第i類信貸客戶樣本的樣本數,表示樣本空間Ok中第j類信貸客戶樣本中的樣本數,i=1,2,…,Lk,j=1,2,…,Lk,i≠j,Lk表示樣本空間Ok中的樣本類別數;表示樣本空間Ok中第i類的信貸客戶樣本的樣本中心;表示樣本空間Ok中第j類的信貸客戶樣本的樣本中心;表示樣本空間Ok中第i類信貸客戶樣本中的第t個樣本;表示樣本空間Ok中第j類信貸客戶樣本中的第t個樣本;表示樣本空間Ok中距離第i類信貸客戶樣本中心最近的第j類信貸客戶樣本;表示樣本空間Ok中距離第j類信貸客戶樣本中心最近的第i類信貸客戶樣本;
步驟4.3:依照上述步驟4.1至4.2,得到每一個候選信貸客戶特征子集對應的NSD值;
步驟五:對步驟四獲得的所有候選信貸客戶特征子集的NSD值進行比較,選出NSD值最大時的候選特征子集作為最終的信貸客戶特征子集。
2.如權利要求1所述的多過濾器結合NSD指標的信貸客戶特征選擇方法,其特征在于,所述的步驟三包括:
步驟3.1,設置一個閾值T,并將其初始化為0;
步驟3.2,初始化一個用于存放所有候選特征子集的集合C;
步驟3.3,按照Tg+1=Tg+1增加閾值,其中Tg表示第g個閾值,T0=0,搜索閾值為Tg+1時信貸客戶特征排序矩陣前Tg+1行中的所有信貸客戶特征,并將每一列都存在的共同特征選出,作為一個候選特征子集,加入到集合C中;
步驟3.4:重復上述步驟3.3,直至閾值等于信貸客戶特征排序矩陣P的行數M,得到的集合C為候選特征集,C=A1,A2,...,Ak,...,AK。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北大學,未經西北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910124047.1/1.html,轉載請聲明來源鉆瓜專利網。





