[發(fā)明專利]一種基于用戶行為特征的信用卡還款概率預(yù)測方法在審
| 申請?zhí)枺?/td> | 202011294383.X | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112330047A | 公開(公告)日: | 2021-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 張鎮(zhèn)洋;黃小明 | 申請(專利權(quán))人: | 交通銀行股份有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/02 |
| 代理公司: | 上海科盛知識產(chǎn)權(quán)代理有限公司 31225 | 代理人: | 葉敏華 |
| 地址: | 200120 上海市浦*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 行為 特征 信用卡 還款 概率 預(yù)測 方法 | ||
1.一種基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,包括:
獲取用戶相關(guān)數(shù)據(jù),包括用戶交易信息、社交信息、征信信息、APP瀏覽和網(wǎng)頁瀏覽信息以及催收信息,并對獲取的每一個(gè)用戶包含的各類信息作為一個(gè)樣本;
對獲取的用戶相關(guān)數(shù)據(jù)進(jìn)行清洗;
對清洗后的數(shù)據(jù)構(gòu)建統(tǒng)計(jì)特征、業(yè)務(wù)特征和編碼特征;
對構(gòu)建的特征進(jìn)行篩選,獲取用以訓(xùn)練模型的特征;
以篩選出的特征作為單模型的輸入,以超過設(shè)定的閾值天數(shù)是否還款作為單模型的輸出,采用分類算法進(jìn)行多種類單模型訓(xùn)練,并對各模型進(jìn)行參數(shù)調(diào)整,選取出用以融合的最優(yōu)單模型;
將選取的最優(yōu)單模型進(jìn)行融合,獲取融合模型;
將實(shí)際待預(yù)測的樣本用戶特征輸入融合模型,獲取還款概率。
2.根據(jù)權(quán)利要求1所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,所述用戶相關(guān)數(shù)據(jù)通過銀行自有系統(tǒng)、社交網(wǎng)絡(luò)、銀行合作方系統(tǒng)和第三方系統(tǒng)進(jìn)行獲取。
3.根據(jù)權(quán)利要求1所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,對獲取的用戶相關(guān)數(shù)據(jù)進(jìn)行清洗的具體內(nèi)容包括:
a)對用戶交易信息、社交信息、征信信息、APP瀏覽和網(wǎng)頁瀏覽信息以及催收信息中存在唯一值或單一值數(shù)量超過95%的值進(jìn)行刪除;
b)對用戶交易信息、社交信息、征信信息、APP瀏覽和網(wǎng)頁瀏覽信息以及催收信息中全空或缺失值占比超過95%的值進(jìn)行刪除;
c)對用戶交易信息、社交信息、征信信息、APP瀏覽和網(wǎng)頁瀏覽信息以及催收信息中重復(fù)的數(shù)據(jù)值進(jìn)行刪除;
d)對全空值、特征95%以上缺失的樣本進(jìn)行刪除;
e)對缺失值和異常值進(jìn)行填充和替換。
4.根據(jù)權(quán)利要求1所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,所述統(tǒng)計(jì)特征包括用戶交易數(shù)據(jù)、信用卡數(shù)據(jù)、瀏覽網(wǎng)頁數(shù)據(jù)、APP瀏覽數(shù)據(jù)、征信數(shù)據(jù)的總和、均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差和頻數(shù)。
5.根據(jù)權(quán)利要求1所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,所述業(yè)務(wù)特征包括根據(jù)業(yè)務(wù)含義構(gòu)建的特征。
6.根據(jù)權(quán)利要求1所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,所述編碼特征包括用戶網(wǎng)頁瀏覽記錄和APP瀏覽記錄,所述用戶網(wǎng)頁瀏覽記錄和所述APP瀏覽記錄采用編碼方式實(shí)現(xiàn)統(tǒng)一長度編碼。
7.根據(jù)權(quán)利要求1所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,對構(gòu)建的特征進(jìn)行篩選的具體內(nèi)容包括:
1)刪除低重要性特征:計(jì)算各特征的IV值,將IV值小于0.02的特征進(jìn)行刪除;
2)計(jì)算特征兩兩之間的相關(guān)系數(shù),若兩個(gè)特征之間的相關(guān)系數(shù)大于0.8,則刪除二者中IV值小的特征;
3)計(jì)算各特征的VIF值,將VIF值大于10的特征進(jìn)行剔除;
4)對各特征中缺失值占比超過95%以上的特征進(jìn)行刪除;
5)將任意特征之間兩兩相乘,同時(shí)對各特征取平方,生成新的特征。
8.根據(jù)權(quán)利要求1所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,在采用分類算法進(jìn)行模型訓(xùn)練中,若未超過設(shè)定的閾值天數(shù),則將模型輸出賦值為0,若超過設(shè)定的閾值天數(shù),則將模型輸出賦值為1。
9.根據(jù)權(quán)利要求8所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,通過ROC、F1、KS指標(biāo)評價(jià)分類算法中的各個(gè)單模型的訓(xùn)練結(jié)果,選取最優(yōu)單模型進(jìn)行模型融合。
10.根據(jù)權(quán)利要求9所述的基于用戶行為特征的信用卡還款概率預(yù)測方法,其特征在于,獲取還款概率后,根據(jù)還款概率進(jìn)行分類,若還款概率大于0.8,則判定其對應(yīng)的用戶為高還款概率用戶,若還款概率的值在[0.3,0.8]之間,則判定其對應(yīng)的用戶為中還款概率用戶,若還款概率的值在0.3以下,則判定其對應(yīng)的用戶為低還款概率用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于交通銀行股份有限公司,未經(jīng)交通銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011294383.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理





