[發明專利]數據處理方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010238056.6 | 申請日: | 2020-03-30 |
| 公開(公告)號: | CN111461863A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 楊情;李京昊;劉揚;陳鵬程 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 唐述燦 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 計算機 設備 存儲 介質 | ||
本申請關于一種數據處理方法、裝置、計算機設備及存儲介質,涉及金融服務技術領域。所述方法包括:獲取在線網絡業務的用戶數據;將用戶數據輸入信用評分卡模型,獲得用戶數據的初步數據處理結果;響應于初步數據處理結果指示用戶數據對應的用戶為候選用戶,將用戶數據輸入至數據處理規則模型中得到用戶數據的數據處理結果。使得服務器能夠在信用評分卡模型判斷的基礎上,進一步通過數據處理規則模型對用戶數據進行進一步判斷,以減少對局部非目標用戶的誤判率。
技術領域
本申請涉及金融服務技術領域,特別涉及一種數據處理方法、裝置、計算機設備及存儲介質。
背景技術
基于互聯網提供的網絡服務中存在一定的安全風險。比如對于金融借貸類的網絡服務中,需要對用戶的信用進行評估。
相關技術中采用信用評分卡模型對在線網絡業務的用戶數據的進行信用評估。
在上述相關技術中,信用評分卡模型在城市區域,用戶渠道等用戶差異化處理上,表現能力不夠,即確定非目標用戶的能力有限,容易產生對局部非目標用戶產生誤判的情況。
發明內容
本申請關于一種數據處理方法、裝置、計算機設備及存儲介質,該技術方案如下:
一方面,提供了一種數據處理方法,所述方法包括:
獲取在線網絡業務的用戶數據;
將所述用戶數據輸入信用評分卡模型,獲得所述用戶數據的初步數據處理結果;
響應于所述初步數據處理結果指示所述用戶數據對應的用戶為候選用戶,將所述用戶數據輸入至數據處理規則模型中得到所述用戶數據的數據處理結果,所述數據處理結果用以指示所述用戶數據對應的用戶是否為目標用戶,所述數據處理規則模型是根據第一訓練集訓練得到的,所述第一訓練集包括白樣本和黑樣本,所述白樣本是指已確定為目標用戶的用戶數據,所述黑樣本是指已確定為非目標用戶的用戶數據,所述目標用戶是所述在線網絡業務可服務的對象,所述非目標用戶是所述在線網絡業務不可服務的對象。
在一種可能的實現方式中,所述方法還包括基于所述第一訓練集生成所述數據處理規則模型,所述數據處理規則模型的訓練過程包括:
在第1次迭代過程中,基于所述第一訓練集生成第一規則,所述第一規則是指從所述第一訓練集中篩選出所述黑樣本時,黑樣本率最高的規則;
剔除所述第一訓練集中命中所述第一規則的樣本,生成第二訓練集;
在第n次迭代過程中,基于第n訓練集生成第n規則,所述第n規則是指從所述第n訓練集中篩選出所述黑樣本時,所述黑樣本率最高的規則,n為正整數;
剔除所述第n訓練集中命中所述第n規則的樣本,生成第n+1訓練集;
響應于所述第n+1訓練集滿足指定條件,停止迭代;
將所述第一規則至所述第n規則進行組合,生成所述數據處理規則模型。
在一種可能的實現方式中,所述在第n次迭代過程中,基于所述第n訓練集生成第n規則,包括:
基于所述第n訓練集構建m個決策樹模型,其中,構建m個所述決策樹模型所使用的N個特征組中,每個所述特征組中均存在至少一個特征與其他所述特征組不相同,m,N為正整數;
獲取m個所述決策樹模型的各個葉子節點中的所述黑樣本率和黑樣本召回率,所述黑樣本召回率是指,通過所述葉子節點篩選出的黑樣本數量占所述葉子節點中黑樣本總數的比例;
根據各個所述決策樹模型中各個所述葉子節點的所述黑樣本率和所述黑樣本召回率確定規則路徑集;
確定所述規則路徑集中所述黑樣本率最高的所述規則路徑所對應的子特征組為所述第n規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010238056.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種科技文檔的聚類方法
- 下一篇:事件對業務量的影響的確定方法及裝置





