[發(fā)明專利]一種用于信貸反欺詐的攔截策略衍生方法、系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202210278143.3 | 申請(qǐng)日: | 2022-03-21 |
| 公開(kāi)(公告)號(hào): | CN114638688A | 公開(kāi)(公告)日: | 2022-06-17 |
| 發(fā)明(設(shè)計(jì))人: | 季爽;陳良;顧志文;李劍;許磊磊 | 申請(qǐng)(專利權(quán))人: | 江蘇城鄉(xiāng)建設(shè)職業(yè)學(xué)院 |
| 主分類號(hào): | G06Q40/02 | 分類號(hào): | G06Q40/02;G06F21/56;G06K9/62 |
| 代理公司: | 蘇州國(guó)誠(chéng)專利代理有限公司 32293 | 代理人: | 陳松 |
| 地址: | 213147 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 信貸 欺詐 攔截 策略 衍生 方法 系統(tǒng) | ||
1.一種用于信貸反欺詐的攔截策略衍生方法,其特征在于,包括以下步驟:
獲取樣本數(shù)據(jù),在樣本數(shù)據(jù)中提取用戶相關(guān)的特征變量,進(jìn)行數(shù)據(jù)預(yù)處理,對(duì)特征變量進(jìn)行分箱處理,獲得變量分箱;
計(jì)算特征變量在每個(gè)變量分箱下的WOE值,根據(jù)計(jì)算得到WOE值,計(jì)算特征變量的IV值,剔除IV值小于設(shè)定值的特征變量;
對(duì)保留的特征變量進(jìn)行WOE編碼,用計(jì)算得到的每個(gè)變量分箱的WOE值替換變量分箱對(duì)應(yīng)的特征變量的數(shù)值;
依據(jù)時(shí)間窗口將樣本數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,基于邏輯回歸模型建立預(yù)測(cè)模型,通過(guò)訓(xùn)練集訓(xùn)練預(yù)測(cè)模型,得到訓(xùn)練好的預(yù)測(cè)模型;通過(guò)測(cè)試集對(duì)訓(xùn)練好的預(yù)測(cè)模型進(jìn)行測(cè)試,通過(guò)評(píng)價(jià)指標(biāo)AUC對(duì)預(yù)測(cè)模型進(jìn)行評(píng)估,調(diào)整模型參數(shù),獲得最佳預(yù)測(cè)模型;
通過(guò)最佳預(yù)測(cè)模型計(jì)算所有變量分箱的評(píng)分,將評(píng)分不大于設(shè)定閾值的變量分箱進(jìn)行交叉生成攔截策略;驗(yàn)證攔截策略是否滿足上線條件,保留所有滿足上線條件的攔截策略,所述攔截策略用于識(shí)別具有高逾期風(fēng)險(xiǎn)的用戶。
2.根據(jù)權(quán)利要求1所述的一種用于信貸反欺詐的攔截策略衍生方法,其特征在于,所述的獲取樣本數(shù)據(jù),在樣本數(shù)據(jù)中提取用戶相關(guān)的特征變量,進(jìn)行數(shù)據(jù)預(yù)處理,對(duì)特征變量進(jìn)行分箱處理,獲得變量分箱,具體包括:
以信貸業(yè)務(wù)中的正常用戶為白樣本,逾期用戶為黑樣本,進(jìn)行用戶打標(biāo),獲得樣本數(shù)據(jù);
在樣本數(shù)據(jù)中提取用戶相關(guān)的特征變量,所述特征變量包括數(shù)值型特征變量和類別型特征變量;
對(duì)樣本數(shù)據(jù)中的異常值和缺失值進(jìn)行處理;
對(duì)預(yù)處理后的特征變量進(jìn)行分箱處理,獲得變量分箱。
3.根據(jù)權(quán)利要求2所述的一種用于信貸反欺詐的攔截策略衍生方法,其特征在于:在進(jìn)行分箱處理時(shí),對(duì)于數(shù)值型特征變量,按照指定數(shù)量進(jìn)行等頻分箱,對(duì)類別型特征變量,每個(gè)類別各自為一個(gè)分箱,若類別數(shù)大于指定最大分箱數(shù),合并占比較小的類別至一個(gè)分箱。
4.根據(jù)權(quán)利要求1所述的一種用于信貸反欺詐的攔截策略衍生方法,其特征在于:特征變量在每個(gè)變量分箱下的WOE值,通過(guò)如下公式計(jì)算:
其中,其中WOEi表示第i組分箱的WOE值,Badi表示第i組分箱中逾期用戶數(shù)量,BadT是整體逾期用戶數(shù)量,Goodi表示第i組分箱中正常用戶數(shù)量,GoodT是整體正常用戶數(shù)量;
特征變量的IV值通過(guò)如下公式計(jì)算:
其中,IVi在特征變量在第i組分箱中的IV值,IV表示特征變量的IV值。
5.根據(jù)權(quán)利要求4所述的一種用于信貸反欺詐的攔截策略衍生方法,其特征在于:預(yù)測(cè)模型基于邏輯回歸模型構(gòu)建,通過(guò)如下公式表示:
z=θ0+θ1*x1+θ2*x2+θ3*x3...θi*xi
其中,h表示預(yù)測(cè)模型輸出的概率值,表示預(yù)測(cè)為逾期用戶的概率,θi表示預(yù)測(cè)模型擬合出的各特征變量的系數(shù)值,θ0單獨(dú)表示為偏置項(xiàng),xi表示各特征變量的具體值;
評(píng)價(jià)指標(biāo)AUC為ROC曲線下與坐標(biāo)軸圍成的面積,ROC曲線的橫坐標(biāo)是偽陽(yáng)率,縱坐標(biāo)是真陽(yáng)率,采用如下公式計(jì)算:
其中TPrate為真陽(yáng)率,表示所有真實(shí)類別為1的樣本中,預(yù)測(cè)類別為1的比例;FPrate為偽陽(yáng)率,表示所有真實(shí)類別為0的樣本中,預(yù)測(cè)類別為1的比例;TP表示預(yù)測(cè)為1,且預(yù)測(cè)正確,實(shí)際為1;P表示預(yù)測(cè)為1,預(yù)測(cè)錯(cuò)誤,實(shí)際為0;FN表示預(yù)測(cè)為0,預(yù)測(cè)錯(cuò)誤,實(shí)際為1;TN表示預(yù)測(cè)為0,預(yù)測(cè)正確,實(shí)際為0;
通過(guò)在測(cè)試集上調(diào)整預(yù)測(cè)模型的特征變量的系數(shù)值,使得模型在測(cè)試集上AUC值最大,獲得最佳預(yù)測(cè)模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇城鄉(xiāng)建設(shè)職業(yè)學(xué)院,未經(jīng)江蘇城鄉(xiāng)建設(shè)職業(yè)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210278143.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險(xiǎn);稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險(xiǎn),例如,風(fēng)險(xiǎn)分析或養(yǎng)老金
- 銀行信貸管理中客戶信息的處理方法及系統(tǒng)
- 用于產(chǎn)生信貸反饋環(huán)的系統(tǒng)和方法
- 基于信貸產(chǎn)品庫(kù)的信貸方法、裝置、設(shè)備和可讀存儲(chǔ)介質(zhì)
- 信貸數(shù)據(jù)的處理方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 基于工作流引擎的信貸流程配置方法、裝置、設(shè)備和介質(zhì)
- 基于智能合約的信貸網(wǎng)絡(luò)
- 一種信貸額度控制方法及裝置
- 信貸數(shù)據(jù)處理、信貸分配方法、裝置及電子設(shè)備
- 信貸額度管理方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 信貸檔案處理方法、裝置、設(shè)備、系統(tǒng)、介質(zhì)及程序產(chǎn)品
- 一種通信業(yè)務(wù)欺詐行為的實(shí)時(shí)識(shí)別系統(tǒng)和方法
- 欺詐事件的識(shí)別方法和裝置
- 一種電信欺詐用戶分析方法及裝置
- 一種欺詐度量方法
- 一種面向金融領(lǐng)域的反欺詐調(diào)查方法及系統(tǒng)
- 欺詐行為的判斷方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 信貸反欺詐方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種詐騙監(jiān)控程序
- 基于用戶行為數(shù)據(jù)的多規(guī)則反欺詐預(yù)測(cè)方法及系統(tǒng)
- 基于大數(shù)據(jù)的信貸反欺詐識(shí)別方法、裝置、設(shè)備及介質(zhì)





