[發明專利]基于融合模型的用戶風險預測方法、系統和計算機設備有效
| 申請號: | 202110473736.0 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113298120B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 姜潤洲;丁楠;蘇綏綏 | 申請(專利權)人: | 上海淇玥信息技術有限公司 |
| 主分類號: | G06F18/25 | 分類號: | G06F18/25;G06F18/214;G06Q10/0635;G06Q10/04 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 201500 上海市崇明*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 融合 模型 用戶 風險 預測 方法 系統 計算機 設備 | ||
1.一種基于融合模型的用戶風險預測方法,其用于對分配有資源的用戶在資源使用期間的資源使用狀態變更進行預測,其特征在于,包括:
獲取歷史用戶的資源使用表現數據、用戶風險數據,并基于切分參數建立多個子訓練數據集和子測試數據集,所述切分參數包括時間參數和/或渠道參數,該時間參數用于表征將用戶的資源使用總時間等間隔劃分的時間段,所述時間參數包括資源使用總時間、間隔時間,該資源使用總時間包括6個月、12個月和24個月,間隔時間包括十五天、三十天、六十天;該渠道參數用于表征用戶群的數據渠道,所述渠道參數包括渠道類型、渠道名稱、與渠道相關的用戶交易數據;所述歷史用戶為在資源使用期間發生了資源使用狀態變更的用戶群,所述資源使用表現數據包括使用狀態變更數據,所述切分參數為單維度或多維度;
建立基于切分參數的多個基模型,并使用相應子訓練數據集訓練對應基模型,對所述多個基模型進行融合處理,得到初始融合模型,使用機器學習模型學習各基模型的資源使用表現數據與用戶風險數據的對應關系、以及所述基模型之間的數據分布變化,得到與各基模型相對應的初始權重系數,并擬合生成與初始融合模型相對應的趨勢圖;
確定待預測用戶的時間特征數據,該時間特征數據包括資源使用總時間T、使用期數T1~Tn、當前資源使用時間Tn,以及該待預測的資源使用時間Tn+t;
使用所述初始融合模型的擬合趨勢圖,計算該預測用戶在資源使用時間Tn+t的用戶風險計算值,選出與該用戶風險計算值最接近的基模型,并確定資源使用時間為Tn所對應的一個或多個子訓練數據集作為增量學習的訓練數據集,所述最接近的基模型為一個或多個,在所述初始融合模型的基礎上二次融合處理,得到與待預測用戶相對應的最終融合模型;
使用所述最終融合模型,計算待預測用戶的風險值,預測所述待預測用戶的資源使用狀態。
2.根據權利要求1所述的用戶風險預測方法,其特征在于,所述在所述初始融合模型的基礎上二次融合處理,得到與待預測用戶相對應的最終融合模型包括:
對所最接近的基模型的初始權重系數進行調整,并使各基模型使用所確定的訓練數據集進行增量學習,以得到與待預測用戶相對應的最終融合模型。
3.根據權利要求1所述的用戶風險預測方法,其特征在于,還包括:
將待預測用戶的時間特征數據、與渠道參數相對應的渠道特征數據、資源使用表現數據,輸入所述最終融合模型,計算所述預測用戶的風險值,該風險值為0~1之間的數值;
根據所計算的風險值,確定用戶資源使用狀態,該用戶資源使用狀態包括與風險級別相對應的第一風險狀態、第二風險狀態、第三風險狀態。
4.根據權利要求1所述的用戶風險預測方法,其特征在于,還包括:
設定評價指標,通過計算所述評價指標,使用相應子測試數據集,對所述初始融合模型的模型參數進行調整,所述評價指標包括ROC指標、AUC指標,所述模型參數包括各基模型的權重系數;
在所計算的評價指標小于特定閾值時,結束所述初始融合模型的模型參數的調整。
5.根據權利要求1所述的用戶風險預測方法,其特征在于,所述資源使用表現數據包括在資源使用的特定時間內的動支次數或頻率、在自特定資源使用時間起特定時間內資源未歸還數據和未歸還次數以及催收數據,所述用戶風險數據包括逾期數據和/或違約數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海淇玥信息技術有限公司,未經上海淇玥信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110473736.0/1.html,轉載請聲明來源鉆瓜專利網。





