[發(fā)明專利]一種基于大數(shù)據(jù)的互聯(lián)網(wǎng)金融用戶貸款逾期預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811401139.1 | 申請(qǐng)日: | 2018-11-22 |
| 公開(公告)號(hào): | CN109255506B | 公開(公告)日: | 2022-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 王進(jìn);趙金陽;許景益;歐陽衛(wèi)華;孫開偉;鄧欣;陳喬松;李林潔 | 申請(qǐng)(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06Q40/02 |
| 代理公司: | 重慶市恒信知識(shí)產(chǎn)權(quán)代理有限公司 50102 | 代理人: | 劉小紅;陳棟梁 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 互聯(lián)網(wǎng) 金融 用戶 貸款 逾期 預(yù)測(cè) 方法 | ||
1.一種基于大數(shù)據(jù)的互聯(lián)網(wǎng)金融用戶貸款逾期預(yù)測(cè)方法,其特征在于,包括以下步驟:
101、數(shù)據(jù)預(yù)處理操作,根據(jù)用戶行為、用戶基本信息、信用評(píng)分?jǐn)?shù)據(jù)進(jìn)行包括近似空缺填充、按照時(shí)間去重在內(nèi)的數(shù)據(jù)預(yù)處理操作;
102、根據(jù)七折交叉驗(yàn)證法對(duì)數(shù)據(jù)進(jìn)行劃分操作,將數(shù)據(jù)分為訓(xùn)練集和測(cè)試集;
103、根據(jù)對(duì)抗網(wǎng)絡(luò)生成模型擴(kuò)展訓(xùn)練集,學(xué)習(xí)到原始數(shù)據(jù)的分布;
104、根據(jù)用戶行為、用戶基本信息、信用評(píng)分?jǐn)?shù)據(jù)進(jìn)行特征工程構(gòu)建操作,通過卷積神經(jīng)網(wǎng)絡(luò)獲取用戶基本信息局部特征、時(shí)序特征及用戶行為特征;
105、建立4個(gè)機(jī)器學(xué)習(xí)模型,并進(jìn)行線性回歸模型融合操作;
106、通過步驟105已建立的機(jī)器學(xué)習(xí)模型,根據(jù)用戶基本信息設(shè)置人工閾值規(guī)則預(yù)測(cè)用戶是否違約,識(shí)別高違約用戶;
所述步驟103根據(jù)對(duì)抗網(wǎng)絡(luò)生成模型擴(kuò)展訓(xùn)練集,具體包括:隨機(jī)生成與真實(shí)數(shù)據(jù)同規(guī)模數(shù)據(jù)傳入生成網(wǎng)絡(luò)G,真實(shí)數(shù)據(jù)和生成網(wǎng)絡(luò)G輸出結(jié)果采樣后輸入判別網(wǎng)絡(luò)D計(jì)算損失,反向更新優(yōu)化模型,使G學(xué)習(xí)到原始數(shù)據(jù)的分布,從而達(dá)到擴(kuò)展訓(xùn)練集的目的;
所述步驟104通過卷積神經(jīng)網(wǎng)絡(luò)獲取用戶基本信息局部特征具體包括:
卷積神經(jīng)網(wǎng)絡(luò)獲取用戶基本信息局部特征:用戶基本信息非連續(xù)性屬性和連續(xù)性屬性構(gòu)造為矩陣matrix作為輸入層,用戶基本信息通過矩陣matrix傳入卷積神經(jīng)網(wǎng)絡(luò)中卷積層,卷積核在輸入層上通過逐一滑動(dòng)窗口局部感知,權(quán)值W共享降低了參數(shù)數(shù)量,也提供了對(duì)用戶隱藏信息擬合能力,然后更高層次對(duì)局部進(jìn)行綜合操作,從用戶信息數(shù)據(jù)得到全局信息特征;將卷積層結(jié)果feature map矩陣展開為一維向量,對(duì)應(yīng)連接相應(yīng)的用戶id,作為機(jī)器學(xué)習(xí)特征,卷積神經(jīng)網(wǎng)絡(luò)獲取用戶基本信息局部特征;
所述步驟104通過卷積神經(jīng)網(wǎng)絡(luò)獲取用戶基本信息時(shí)序特征具體包括:按照不同時(shí)間粒度提取用戶特征,劃分不同時(shí)間窗口大小,統(tǒng)計(jì)一個(gè)時(shí)間窗口用戶申請(qǐng)貸款總次數(shù)、貸款金額、支付方式,每天申請(qǐng)貸款金額;
同一時(shí)間窗口的每天權(quán)值不一樣,按照距離預(yù)測(cè)目標(biāo)越近,其權(quán)重越大,其中,X為時(shí)間粒度為t天用戶貸款總次數(shù),w1、w2、w3......wt為時(shí)間粒度為t天每天權(quán)值,x1、x2、x3......xt為時(shí)間粒度為t天用戶每天貸款次數(shù); wi權(quán)重和用戶在時(shí)間粒度為t天貸款總次數(shù)按公式表述如下:
X=x1*w1+x2*w2+…+xt*wt 公式(5);
所述步驟104通過卷積神經(jīng)網(wǎng)絡(luò)獲取用戶行為特征,具體包括:從業(yè)務(wù)層面分析用戶行為,分析用戶是否違約與歷史行為關(guān)系,其用戶行為特征有申請(qǐng)貸款金額、支付方式、借貸前/后購買次數(shù)、借貸前購買最大值、借貸前購買最小值;
所述步驟101數(shù)據(jù)預(yù)處理操作包括:對(duì)基礎(chǔ)字段下用戶行為、用戶基本信息、信用評(píng)分?jǐn)?shù)據(jù),具體處理包括:
(1)近似空缺填充:在完整數(shù)據(jù)集中找到相似用戶屬性值進(jìn)行填充,用戶相似通過皮爾遜相關(guān)系數(shù)得到,其中,E為數(shù)學(xué)期望,D為方差,X、Y分別代表兩個(gè)樣本,兩個(gè)用戶之間的皮爾遜相關(guān)性為ρXY,皮爾遜相關(guān)性計(jì)算如下:
(2)原始用戶行為表用戶id含有重復(fù)的樣本,按照時(shí)間去重,保留用戶距離預(yù)測(cè)日期最近行為發(fā)生樣本,減少信息冗余;
所述步驟105建立4個(gè)機(jī)器學(xué)習(xí)模型,并進(jìn)行線性回歸融合操作,具體包括:
使用Factorization Machines因子分解機(jī)FM、CatBoost、LightGBM、Adaboost算法對(duì)訓(xùn)練集七折交叉驗(yàn)證,得到不同的機(jī)器學(xué)習(xí)模型,Y為驗(yàn)證集真實(shí)標(biāo)簽,x1、x2、x3、x4為Factorization Machines(FM)、CatBoost、LightGBM、Adaboost對(duì)模型進(jìn)行訓(xùn)練集七折交叉驗(yàn)證預(yù)測(cè)結(jié)果,線性回歸擬合驗(yàn)證集真實(shí)標(biāo)簽,求得各個(gè)模型的參數(shù)w;
Y=x1*w1+x2*w2+x3*w3+x4*w4 公式(6)
對(duì)于測(cè)試集使用Factorization Machines(FM)、CatBoost、LightGBM、Adaboost預(yù)測(cè)結(jié)果為X1、X2、X3、X4,將其預(yù)測(cè)結(jié)果分別乘以各個(gè)模型權(quán)重u,得到最終的預(yù)測(cè)結(jié)果;
P=X1*u1+X2*u2+X3*u3+X4*u4 公式(7)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811401139.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實(shí)現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動(dòng)攝像終端進(jìn)行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護(hù)用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點(diǎn)中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品
- 一種金融服務(wù)系統(tǒng)、金融服務(wù)平臺(tái)及其方法
- 一種移動(dòng)終端搭載金融支付終端的方法及金融支付系統(tǒng)
- 一種基于微信小程序及金融開放平臺(tái)的金融能力輸出模式
- 金融產(chǎn)品推薦方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于三維坐標(biāo)定位的金融憑證智能存放系統(tǒng)及其裝置
- 基于云計(jì)算和區(qū)塊鏈的金融信息管理系統(tǒng)
- 基于數(shù)據(jù)倉庫的金融數(shù)據(jù)自動(dòng)化測(cè)試與監(jiān)控系統(tǒng)
- 基于金融應(yīng)用的風(fēng)險(xiǎn)監(jiān)測(cè)方法及系統(tǒng)
- 金融數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 金融憑證智能存放裝置





