[發(fā)明專利]基于融合模型的用戶風(fēng)險預(yù)測方法、系統(tǒng)和計算機設(shè)備有效
| 申請?zhí)枺?/td> | 202110473736.0 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113298120B | 公開(公告)日: | 2023-08-01 |
| 發(fā)明(設(shè)計)人: | 姜潤洲;丁楠;蘇綏綏 | 申請(專利權(quán))人: | 上海淇玥信息技術(shù)有限公司 |
| 主分類號: | G06F18/25 | 分類號: | G06F18/25;G06F18/214;G06Q10/0635;G06Q10/04 |
| 代理公司: | 北京清誠知識產(chǎn)權(quán)代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 201500 上海市崇明*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 融合 模型 用戶 風(fēng)險 預(yù)測 方法 系統(tǒng) 計算機 設(shè)備 | ||
本發(fā)明提供了一種基于融合模型的用戶風(fēng)險預(yù)測方法、系統(tǒng)和計算機設(shè)備。該方法包括:獲取歷史用戶的資源使用表現(xiàn)數(shù)據(jù)、用戶風(fēng)險數(shù)據(jù),并基于切分參數(shù)建立多個子訓(xùn)練數(shù)據(jù)集和子測試數(shù)據(jù)集;建立基于切分參數(shù)的多個基模型,并使用相應(yīng)子訓(xùn)練數(shù)據(jù)集訓(xùn)練對應(yīng)基模型,對多個基模型進行融合處理,得到初始融合模型;獲取待預(yù)測用戶的資源使用表現(xiàn)數(shù)據(jù),確定與該預(yù)測用戶相對應(yīng)的基模型以及用于增量學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集,進行二次融合處理,得到與待預(yù)測用戶相對應(yīng)的最終融合模型;使用最終融合模型,計算待預(yù)測用戶的風(fēng)險值,預(yù)測所述待預(yù)測用戶的資源使用狀態(tài)。本發(fā)明實現(xiàn)了更精確的用戶群分類,更精確預(yù)測了用戶的資源使用狀態(tài),提高了模型精度。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機信息處理領(lǐng)域,具體而言,涉及一種基于融合模型的用戶風(fēng)險預(yù)測方法、系統(tǒng)和計算機設(shè)備。
背景技術(shù)
風(fēng)險預(yù)測是對風(fēng)險的量化,是風(fēng)險管理的關(guān)鍵性技術(shù)。目前一般通過建模的方式進行風(fēng)險預(yù)測,在模型的建立過程中,主要有數(shù)據(jù)抽取、特征生成、特征選取、算法模型生成和合理性評估等步驟。
在現(xiàn)有技術(shù)中,金融風(fēng)險預(yù)測主要的目的是如何區(qū)分出好客戶和壞客戶,評估用戶的風(fēng)險情況,以降低信用風(fēng)險,并實現(xiàn)利潤最大化。此外,隨著數(shù)據(jù)的來源渠道越來越豐富,可以作為風(fēng)險特征變量的數(shù)據(jù)也越來越多。但是,例如用戶數(shù)據(jù)及其他相關(guān)數(shù)據(jù)等很多數(shù)據(jù)在使用時并未考慮時間因素引起的變化,由此,在使用上述數(shù)據(jù)進行模型計算時,導(dǎo)致模型計算值不夠準(zhǔn)確,甚至對于一些用戶的風(fēng)險評估的準(zhǔn)確性較低。由此,在模型精度提高或模型優(yōu)化、數(shù)據(jù)提取等方面仍存在很大改進空間。
因此,有必要提供一種新的用戶風(fēng)險預(yù)測方法,以進一步提高模型精度,并更精確地預(yù)測不同用戶的風(fēng)險情況。
發(fā)明內(nèi)容
鑒于上述問題,本發(fā)明提供了一種基于融合模型的用戶風(fēng)險預(yù)測方法,其用于對分配有資源的用戶在資源使用期間的資源使用狀態(tài)變更進行預(yù)測,包括:獲取歷史用戶的資源使用表現(xiàn)數(shù)據(jù)、用戶風(fēng)險數(shù)據(jù),并基于切分參數(shù)建立多個子訓(xùn)練數(shù)據(jù)集和子測試數(shù)據(jù)集,所述歷史用戶為在資源使用期間發(fā)生了資源使用狀態(tài)變更的用戶群,所述資源使用表現(xiàn)數(shù)據(jù)包括使用狀態(tài)變更數(shù)據(jù),所述切分參數(shù)為單維度或多維度;建立基于切分參數(shù)的多個基模型,并使用相應(yīng)子訓(xùn)練數(shù)據(jù)集訓(xùn)練對應(yīng)基模型,對所述多個基模型進行融合處理,得到初始融合模型;獲取待預(yù)測用戶的資源使用表現(xiàn)數(shù)據(jù),確定與該預(yù)測用戶相對應(yīng)的基模型以及用于增量學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集,在所述初始融合模型的基礎(chǔ)上二次融合處理,得到與待預(yù)測用戶相對應(yīng)的最終融合模型;使用所述最終融合模型,計算待預(yù)測用戶的風(fēng)險值,預(yù)測所述待預(yù)測用戶的資源使用狀態(tài)。
優(yōu)選地,所述切分參數(shù)包括時間參數(shù)和/或渠道參數(shù),其中,該時間參數(shù)用于表征將用戶的資源使用總時間等間隔劃分的時間段,所述時間參數(shù)包括資源使用總時間、間隔時間,該資源使用總時間包括6個月、12個月和24個月,間隔時間包括十五天、三十天、六十天;該渠道參數(shù)用于表征用戶群的數(shù)據(jù)渠道,所述渠道參數(shù)包括渠道類型、渠道名稱、與渠道相關(guān)的用戶交易數(shù)據(jù)。
優(yōu)選地,所述對所述多個基模型進行融合處理,以得到初始融合模型包括:使用機器學(xué)習(xí)模型學(xué)習(xí)各基模型的資源使用表現(xiàn)數(shù)據(jù)與用戶風(fēng)險數(shù)據(jù)征數(shù)據(jù)的對應(yīng)關(guān)系、以及所述基模型之間的數(shù)據(jù)分布變化,得到與各基模型相對應(yīng)的初始權(quán)重系數(shù),并擬合生成與初始融合模型相對應(yīng)的趨勢圖。
優(yōu)選地,所述獲取待預(yù)測用戶的資源使用表現(xiàn)數(shù)據(jù),確定與該預(yù)測用戶相對應(yīng)的基模型以及用于增量學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集包括:確定待預(yù)測用戶的時間特征數(shù)據(jù),該時間特征數(shù)據(jù)包括資源使用總時間T、使用期數(shù)T1~Tn、當(dāng)前資源使用時間Tn,以及該待預(yù)測的資源使用時間Tn+t;使用所述初始融合模型的擬合趨勢圖,計算該預(yù)測用戶在資源使用時間Tn+t的用戶風(fēng)險計算值,選出與該用戶風(fēng)險計算值最接近的基模型,并確定資源使用時間為Tn所對應(yīng)的一個或多個子訓(xùn)練數(shù)據(jù)集作為增量學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集,所述最接近的基模型為一個或多個。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海淇玥信息技術(shù)有限公司,未經(jīng)上海淇玥信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110473736.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





