[發明專利]基于用戶職業預測的風險評估方法、裝置和電子設備有效
| 申請號: | 202011132010.2 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112348662B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 張靖雯;劉濤 | 申請(專利權)人: | 上海淇玥信息技術有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06F16/36;G06F18/23213;G06F18/2411 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 201500 上海市崇明*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 職業 預測 風險 評估 方法 裝置 電子設備 | ||
本發明提供了一種基于用戶職業預測的風險評估方法、裝置和電子設備。該方法包括:獲取用戶的原始社交文本信息;對用戶的原始社交本文信息進行預處理,并進行詞向量轉換,以生成用戶社交文本的詞向量;使用無監督聚類算法對用戶社交文本的詞向量進行聚類分析,以構建職業類別詞庫,職業類別詞庫用于為各用戶形成職業標簽;構建用戶職業預測模型,使用訓練樣本數據訓練該用戶職業預測模型;使用所述用戶職業預測模型,計算當前用戶的用戶職業評估值;根據所計算的用戶職業評估值,進行用戶職業預測和風險評估。本發明的方法能夠準確評估用戶職業情況,降低了金融風險,還提高了模型預測的精度。
技術領域
本發明涉及計算機信息處理領域,具體而言,涉及一種基于用戶職業預測的風險評估方法、裝置和電子設備。
背景技術
風險控制(簡稱為風控)是指風險管理者采取各種措施和方法,消滅或減少風險案件發生的各種可能性,或風險控制者減少風險案件發生時造成的損失。風險控制一般應用于金融行業,如對公司的交易、商家的交易或個人交易等進行風險控制。
在現有技術中,金融風險評估主要的目的是如何區分出好客戶和壞客戶,評估用戶的風險情況,以降低信用風險實現利潤最大化。目前,對于客戶行職業只能做定性判斷,且覆蓋率較低,對客戶的職業信息利用有限,無法對風險起到及時預警的作用,也無法進行差異化客戶經營。另外,目前對于一些高風險職業的排查,主要以人工審核為主,排查效率較低,每天審核的量也受人力的限制。此外,在模型預測精度方面仍存在很大改進空間。
因此,有必要提供一種精度更高的風險評估方法。
發明內容
為了提高模型預測精度,準確評估用戶的風險情況,進一步降低金融風險,本發明提供了一種基于用戶職業預測的風險評估方法,包括:獲取用戶的原始社交文本信息;對所述用戶的原始社交本文信息進行預處理,并進行詞向量轉換,以生成用戶社交文本的詞向量;使用無監督聚類算法對所述用戶社交文本的詞向量進行聚類分析,以構建職業類別詞庫,所述職業類別詞庫用于為各用戶形成職業標簽;構建用戶職業預測模型,使用訓練樣本數據訓練該用戶職業預測模型,所述訓練樣本數據包括歷史用戶社交文本信息數據、用戶所屬職業類別的表現數據、職業標簽相關數據;使用所述用戶職業預測模型,計算當前用戶的用戶職業評估值;根據所計算的用戶職業評估值,進行用戶職業預測和風險評估。
優選地,所述根據所計算的用戶職業評估值,進行用戶職業預測包括:設定與不同職業類別相對應的特定閾值;將所計算的用戶職業評估值與各特定閾值進行比較,判斷用戶所屬職業的類別,以確定用戶職業標簽。
優選地,所述用戶職業評估值是0~1之間的數值,用于表示用戶所屬職業類別的概率。
優選地,還包括:基于所確定的用戶職業標簽,進一步篩選高危職業的用戶。
優選地,還包括:基于所確定的用戶職業標簽,進行風險策略制定或風險預警。
優選地,還包括:使用高斯混合聚類算法、K-Means聚類算法或基于密度的聚類算法,對所述用戶社交文本的詞向量進行聚類分析,提取職業信息數據,形成不同職業類別的詞庫,以構建職業類別詞庫。
優選地,還包括:基于所述職業類別詞庫,對訓練樣本數據進行打標,以使用帶有標簽的訓練樣本數據訓練用戶職業預測模型;所述用戶職業預測模型使用TextCNN算法、XGBoost算法、隨機森林算法或邏輯回歸算法。
優選地,所述對所述用戶的原始社交本文信息進行預處理包括進行分詞處理和清洗處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海淇玥信息技術有限公司,未經上海淇玥信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011132010.2/2.html,轉載請聲明來源鉆瓜專利網。





