[發(fā)明專利]多維度風(fēng)險特征策略的提取方法在審
| 申請?zhí)枺?/td> | 202111154465.9 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113837865A | 公開(公告)日: | 2021-12-24 |
| 發(fā)明(設(shè)計)人: | 鐘月 | 申請(專利權(quán))人: | 重慶富民銀行股份有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06Q10/06;G06K9/62;G06N20/00 |
| 代理公司: | 重慶強大凱創(chuàng)專利代理事務(wù)所(普通合伙) 50217 | 代理人: | 趙玉乾 |
| 地址: | 401121 重慶市渝*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多維 風(fēng)險 特征 策略 提取 方法 | ||
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種多維度風(fēng)險特征策略的提取方法,包括內(nèi)容:采集源數(shù)據(jù),源數(shù)據(jù)預(yù)處理,生成風(fēng)險特征數(shù)據(jù),采用LightGbm決策樹算法進行模型訓(xùn)練,生成若干個樹結(jié)構(gòu),提取每顆樹結(jié)構(gòu)中的分支節(jié)點和切分閾值;基于每棵樹的分支節(jié)點和切分閾值,對客戶集群進行分箱,計算每個分箱的樣本客戶總量和風(fēng)險樣本客戶總量,將各個分箱的風(fēng)險樣本客戶占比與設(shè)置的風(fēng)險閾值進行比較;若存在風(fēng)險樣本客戶占比大于等于風(fēng)險閾值的分箱,則該棵樹的分支節(jié)點和切分閾值有效,存儲該分支節(jié)點和切分閾值作為多維度風(fēng)險特征策略組合特征。該方法可靈活自動化且批量的進行特征的有效組合,形成量化分析結(jié)果,實現(xiàn)組合策略提取。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體為一種多維度風(fēng)險特征策略的提取方法。
背景技術(shù)
在各行各業(yè),風(fēng)險管控都是十分必要且重要的,尤其是在金融領(lǐng)域,風(fēng)險管控主要包括貸前、貸中和貸后的風(fēng)險管控,在三個不同階段的風(fēng)險策略制定上,除了傳統(tǒng)的專家經(jīng)驗外,還有量化分析方法。現(xiàn)有的量化分析方法通常為單維度風(fēng)險特征策略法。從各方法的優(yōu)劣上,傳統(tǒng)的專家經(jīng)驗方法簡單易落地,但需要基于足夠的風(fēng)控經(jīng)歷和常年的積累,可意會難以言傳,對于人員要求高,成本高,同時因為缺乏量化數(shù)據(jù)的佐證,難有說服力;而單維度風(fēng)險特征策略,是指定中常用的方式方法,但未充分挖掘數(shù)據(jù)源和特征的有效性,在數(shù)據(jù)源成本和數(shù)據(jù)源的效能上未實現(xiàn)效益最大化。
發(fā)明內(nèi)容
本發(fā)明意在提供一種可靈活自動化且批量的進行特征的有效組合的多維度風(fēng)險特征策略的提取方法。
多維度風(fēng)險特征策略的提取方法,包括以下內(nèi)容,
采集源數(shù)據(jù),數(shù)據(jù)預(yù)處理,對源數(shù)據(jù)進行預(yù)處理生成風(fēng)險特征數(shù)據(jù);
基于風(fēng)險特征數(shù)據(jù)和客戶集群,采用LightGbm模型進行訓(xùn)練,生成若干個樹結(jié)構(gòu),提取每顆樹結(jié)構(gòu)中的分支節(jié)點和切分閾值;
基于每棵樹的分支節(jié)點和切分閾值,對客戶集群進行分箱,計算每個分箱的樣本客戶總量和風(fēng)險樣本客戶總量,將各個分箱的風(fēng)險樣本客戶占比與設(shè)置的風(fēng)險閾值進行比較;若存在風(fēng)險樣本客戶占比大于等于風(fēng)險閾值的分箱,則該棵樹的分支節(jié)點和切分閾值有效,則存儲該分支節(jié)點和切分閾值作為多維度風(fēng)險特征策略組合特征。
本發(fā)明的有益效果:本發(fā)明首先對源數(shù)據(jù)進行預(yù)處理,以剔除一些不適合用于模型訓(xùn)練的數(shù)據(jù),從而使生成的風(fēng)險特征數(shù)據(jù)更專業(yè)、準(zhǔn)確、全面和可靠;
本發(fā)明基于風(fēng)險特征數(shù)據(jù)和客戶集群,采用LightGbm模型進行訓(xùn)練,生成若干個樹結(jié)構(gòu),即應(yīng)用LightGbm算法實現(xiàn)多維度風(fēng)險特征策略的提取,通過該方法可以靈活自動化且批量的進行風(fēng)險特征的組合;
本發(fā)明為了進一步驗證多維度風(fēng)險特征策略提取出的風(fēng)險特征組合的有效性和可靠性,基于每棵樹的分支節(jié)點和切分閾值,對客戶集群進行分箱,計算每個分箱的樣本客戶總量和風(fēng)險樣本客戶總量,將各個分箱的風(fēng)險樣本客戶占比與設(shè)置的風(fēng)險閾值進行比較,也即采用量化分析結(jié)果,若存在風(fēng)險樣本客戶占比大于等于風(fēng)險閾值的分箱,則該棵樹的分支節(jié)點和切分閾值有效,并且存儲該分支節(jié)點和切分閾值作為多維度風(fēng)險特征策略組合特征,最終達到充分挖掘數(shù)據(jù)源特征和數(shù)據(jù)源效益最大化的目的。
進一步,為了對源數(shù)據(jù)進行規(guī)范,以便于模型的訓(xùn)練,所述的預(yù)處理包括基于某一類數(shù)據(jù)的缺失率,剔除掉缺失率大的一類數(shù)據(jù),基于數(shù)據(jù)單元素取值占比,剔除掉單元素取值大的數(shù)據(jù),基于數(shù)據(jù)的相關(guān)性,剔除掉相關(guān)性高的數(shù)據(jù),基于數(shù)據(jù)的IV,剔除掉IV低的數(shù)據(jù)。本發(fā)明所述的IV,主要是指對于模型訓(xùn)練是否有用。
進一步,為了比較全面的計算每個分箱的樣本客戶總量和風(fēng)險樣本客戶總量,所述的計算每個分箱的樣本客戶總量和風(fēng)險樣本客戶總量包括計算每個分箱的樣本量、壞樣本量、壞占比、風(fēng)險倍數(shù)以及l(fā)ift風(fēng)險指標(biāo)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶富民銀行股份有限公司,未經(jīng)重慶富民銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111154465.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金
- 風(fēng)險監(jiān)視裝置、風(fēng)險監(jiān)視系統(tǒng)、風(fēng)險監(jiān)視方法
- 風(fēng)險控制方法及風(fēng)險控制裝置
- 風(fēng)險分層
- 風(fēng)險分層
- 風(fēng)險判定裝置、風(fēng)險判定方法以及風(fēng)險判定程序
- 風(fēng)險評價系統(tǒng)以及風(fēng)險評價方法
- 風(fēng)險管理裝置、風(fēng)險管理方法以及風(fēng)險管理程序
- 風(fēng)險測算方法和風(fēng)險測算系統(tǒng)
- 風(fēng)險評估方法及風(fēng)險評估裝置
- 風(fēng)險評估方法及風(fēng)險評估裝置
- 一種計算機網(wǎng)絡(luò)策略管理系統(tǒng)及策略管理方法
- 應(yīng)用于合法監(jiān)聽系統(tǒng)的網(wǎng)絡(luò)策略架構(gòu)及其策略處理方法
- 分發(fā)策略的方法、系統(tǒng)和策略分發(fā)實體
- 策略控制方法、策略規(guī)則決策設(shè)備和策略控制設(shè)備
- 用于控制QoS策略沖突的方法、設(shè)備和系統(tǒng)
- 策略融合的方法、UE及服務(wù)器
- 策略調(diào)整觸發(fā)、策略調(diào)整方法及裝置、策略調(diào)整系統(tǒng)
- 設(shè)備策略管理器
- 策略組中的策略評估、策略選擇方法及裝置
- 策略集群分發(fā)匹配方法、系統(tǒng)及計算機可讀存儲介質(zhì)





