[發明專利]風控文本處理方法、裝置及電子設備在審
| 申請號: | 201911328087.4 | 申請日: | 2019-12-20 |
| 公開(公告)號: | CN111191893A | 公開(公告)日: | 2020-05-22 |
| 發明(設計)人: | 李達;張彤彤;蘇綏綏;常富洋 | 申請(專利權)人: | 北京淇瑀信息科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06F40/284;G06K9/62 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 處理 方法 裝置 電子設備 | ||
1.一種風控文本處理方法,其特征在于,包括:
獲取用戶的風控文本,所述風控文本包括用戶描述文本、應用列表、金融記錄文本;
將所述風控文本輸入文本向量化模型中,生成風控向量;
將所述風控向量輸入風險預測模型中以確定所述用戶的風險類別和其對應的風險概率;以及
基于所述風險類別和其對應的風險概率生成所述用戶的風險策略。
2.如權利要求1所述的方法,其特征在于,還包括:
通過預設的自然語言處理模型進行調整以生成所述文本向量化模型,所述自然語言處理模型包括雙向編解碼模型。
3.如權利要求1-2所述的方法,其特征在于,通過預設的自然語言處理模型進行調整以生成所述文本向量化模型,包括:
確定初始雙向編解碼模型;
基于歷史用戶的風控文本對所述初始雙向編解碼模型的參數進行微調,生成更新參數;以及
基于所述更新參數生成所述文本向量化模型。
4.如權利要求1-3所述的方法,其特征在于,還包括:
通過歷史用戶的風控向量對機器學習模型進行訓練,以生成所述風險預測模型,所述機器學習模型包括極端梯度提升決策樹模型。
5.如權利要求1-4所述的方法,其特征在于,通過歷史用戶的風控向量對機器學習模型進行訓練,以生成所述風險預測模型,包括:
獲取歷史用戶的風控向量;
為所述風控向量確定風險類別標簽;以及
通過所述風控向量及其對應的風險類別標簽對極端梯度提升決策樹模型進行訓練以生成所述風險預測模型。
6.如權利要求1-5所述的方法,其特征在于,獲取歷史用戶的風控向量,包括:
通過所述文本向量化模型對歷史用戶的風控文本進行處理,生成歷史用戶的所述風控向量。
7.如權利要求1-6所述的方法,其特征在于,還包括:
在所述風險類別為未知風險時,將所述用戶的風控向量與預設向量進行對比以確定所述用戶的風險類別。
8.一種風控文本處理裝置,其特征在于,包括:
文本模塊,用于獲取用戶的風控文本,所述風控文本包括用戶描述文本、應用列表、金融記錄文本;
向量模塊,用于將所述風控文本輸入文本向量化模型中,生成風控向量;
預測模塊,用于將所述風控向量輸入風險預測模型中以確定所述用戶的風險類別和其對應的風險概率;以及
策略模塊,用于基于所述風險類別和其對應的風險概率生成所述用戶的風險策略。
9.一種電子設備,其特征在于,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-7中任一所述的方法。
10.一種計算機可讀介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現如權利要求1-7中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京淇瑀信息科技有限公司,未經北京淇瑀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911328087.4/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





