[發(fā)明專利]建立風(fēng)控模型的方法、裝置及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011045716.5 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112200659A | 公開(公告)日: | 2021-01-08 |
| 發(fā)明(設(shè)計)人: | 邵俊;李越;蔡藝齊;周炬;路林林;張磊 | 申請(專利權(quán))人: | 深圳索信達數(shù)據(jù)技術(shù)有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06Q10/06 |
| 代理公司: | 深圳市力道知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44507 | 代理人: | 何姣 |
| 地址: | 518057 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 建立 模型 方法 裝置 存儲 介質(zhì) | ||
1.一種建立風(fēng)控模型的方法,其特征在于,所述方法包括:
獲取用戶歷史數(shù)據(jù)集,所述用戶歷史數(shù)據(jù)集包括用戶歷史數(shù)據(jù),所述用戶歷史數(shù)據(jù)包括用戶的多個不同的第一特征分別對應(yīng)的取值和所述用戶是否違約的標(biāo)簽;
根據(jù)每個第一特征的不同用戶的取值和每個用戶是否違約的標(biāo)簽,對每個第一特征進行特征權(quán)重WOE預(yù)編碼處理;
基于每個第一特征進行WOE預(yù)編碼處理后得到的多個第一箱,從所述第一特征中篩選出第二特征,所述第二特征的數(shù)量小于所述第一特征的數(shù)量;
基于每個第二特征的多個第一箱所有可能的分箱方式,確定每個第二特征的WOE值滿足單調(diào)性的分箱方式,進而得到每個第二特征的多個第二箱;
基于每個第二特征的多個第二箱,利用二分類模型建立所述風(fēng)控模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)每個第一特征的不同用戶的取值和每個用戶是否違約的標(biāo)簽,對每個第一特征進行特征權(quán)重WOE預(yù)編碼處理,包括:
基于每個第一特征的不同用戶的取值和每個用戶是否違約的標(biāo)簽,對每個第一特征進行預(yù)分箱處理,得到每個第一特征的多個第一箱;
對每個第一特征的多個第一箱分別進行WOE變換處理,得到每個第一特征的多個WOE值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于每個第一特征的不同用戶的取值和每個用戶是否違約的標(biāo)簽,對每個第一特征進行預(yù)分箱處理,得到每個第一特征的多個第一箱,包括:
若所述第一特征包括文本型特征,則將每個文本型特征的取值作為一個箱,并確定每個箱的WOE值;
將所有箱按照WOE值的大小進行排序;
對排序后的所有箱進行卡方合并處理,得到每個文本型特征的多個第一箱;
和/或,
若所述第一特征包括數(shù)值型特征,則按照所述數(shù)值型特征的取值的大小進行排序;
按照排序后的順序,將所述數(shù)值型特征的取值通過等頻方式劃分為多個箱;
對排序后的所有箱進行卡方合并處理,得到每個數(shù)值型特征的多個第一箱。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于每個第二特征的多個第一箱所有可能的分箱方式,確定每個第二特征的WOE值滿足單調(diào)性的分箱方式,進而得到每個第二特征的多個第二箱,包括:
基于每個第二特征的多個第一箱所有可能的分箱方式,確定每個第二特征的WOE值滿足單調(diào)性、且是分箱數(shù)目最多的分箱方式,進而得到每個第二特征的多個第二箱。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于每個第二特征的多個第一箱所有可能的分箱方式,確定每個第二特征的WOE值滿足單調(diào)性、且是分箱數(shù)目最多的分箱方式,進而得到每個第二特征的多個第二箱,包括:
基于每個第二特征的多個第一箱,比較所有兩兩相鄰的箱的WOE值,若后面的箱的WOE值大于前面的箱,則確定單調(diào)指數(shù)為1,否則確定單調(diào)指數(shù)為-1,第一箱當(dāng)前的數(shù)目為N;
判斷每個第二特征的多個第一箱的單調(diào)指數(shù)累積絕對值r是否等于N-1,其中所述單調(diào)指數(shù)累積絕對值r等于每個第二特征的多個第一箱的所有單調(diào)指數(shù)之和的絕對值;
若所述第二特征的多個第一箱的r等于N-1,則確定所述第二特征的多個第一箱的WOE值滿足單調(diào)性、且是分箱數(shù)目最多的分箱方式,所述第二特征的多個第一箱即為所述第二特征的多個第二箱;
若所述第二特征的多個第一箱的r不等于N-1,則確定所述第二特征所有分箱數(shù)目為N-1的分箱方式中是否存在r=N-2的分箱方式,若存在r=N-2的分箱方式,則確定r=N-2的分箱方式的WOE值滿足單調(diào)性、且分箱數(shù)目最多,r=N-2的分箱方式對應(yīng)的多個箱即為所述第二特征的多個第二箱;
若不存在r=N-2的分箱方式,則繼續(xù)確定所述第二特征所有分箱數(shù)目為N-2的分箱方式中是否存在r=N-3的分箱方式,直到確定所述第二特征的WOE值滿足單調(diào)性、且分箱數(shù)目最多的分箱方式,進而得到每個第二特征的多個第二箱。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳索信達數(shù)據(jù)技術(shù)有限公司,未經(jīng)深圳索信達數(shù)據(jù)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011045716.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金





