[發明專利]一種風險評估方法及裝置在審
| 申請號: | 202010093501.4 | 申請日: | 2020-02-14 |
| 公開(公告)號: | CN111353689A | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 梅止觀;賀歐文;李詩詩 | 申請(專利權)人: | 北京貝殼時代網絡科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06K9/62;G06N20/00 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 馬瑞 |
| 地址: | 100000 北京市密云*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 風險 評估 方法 裝置 | ||
本發明實施例提供一種風險評估方法及裝置,其中方法包括:獲取待預測用戶所對應的特征數據;將所述特征數據輸入至評分卡模型中,得到所述評分卡模型輸出的風險預測結果;其中,所述評分卡模型預先以樣本用戶所對應的樣本特征數據為訓練樣本,以樣本特征數據所對應的標簽數據為目標值訓練得到,且所述標簽數據已預先通過預設切分點進行二分類切分。本發明實施例實現了通過評分卡模型對多種應用場景的預測。
技術領域
本發明涉及風險評估技術領域,尤其涉及一種風險評估方法及裝置。
背景技術
評分卡是一種常見的機器學習模型,典型應用場景包括銀行放貸和企業征信等,旨在根據個人的基本信息擬合信用狀況進行分數計算。評分卡已經成為具有嚴密理論和方法體系的信用評價手段。但是,經典評分卡僅適用于小數據量,高覆蓋率和高準確性的數據場景中,且只能適用二分類業務場景,而對于互聯網海量,低覆蓋和低質量的數據場景沒有系統性的解決方案,例如在關鍵數據缺失率極高的數據場景中則不適用,且并不能適用多種業務場景。
發明內容
本發明實施例提供一種風險評估方法及裝置,以解決現有技術中只能采用評分模型對二分類業務場景進行風險評估的問題。
本發明實施例提供一種風險評估方法,包括:
獲取待預測用戶所對應的特征數據;
將所述特征數據輸入至評分卡模型中,得到所述評分卡模型輸出的風險預測結果;
其中,所述評分卡模型預先以樣本用戶所對應的樣本特征數據為訓練樣本,以樣本特征數據所對應的標簽數據為目標值訓練得到,且所述標簽數據已預先通過預設切分點進行二分類切分。
可選地,所述將所述特征數據輸入至評分卡模型中,得到所述評分卡模型輸出的預測結果之前,還包括:獲取樣本用戶所對應的樣本特征數據和真實風險值;當所述樣本特征數據的缺失率大于預設缺失閾值時,通過與所述樣本特征數據的數據類型相對應的機器學習模型對所述樣本特征數據進行填充,得到填充后數據,所述填充后數據包括填充后特征數據和所述樣本特征數據所對應的標簽數據;通過所述填充后數據對預設二分類模型進行訓練,得到訓練后模型;通過所述樣本特征數據和所述真實風險值對所述訓練后模型進行準確度測試,并當所述訓練后模型的準確度大于預設準確度閾值時,將所述訓練后模型確定為所述評分卡模型。
可選地,所述通過與所述樣本特征數據的數據類型相對應的機器學習模型對所述樣本特征數據進行填充,得到填充后數據,包括:當所述樣本特征數據的數據類型為連續型時,通過線性模型對所述樣本特征數據進行填充,得到填充后數據;當所述樣本特征數據的數據類型為二分類型時,通過邏輯回歸模型對所述樣本特征數據進行填充,得到填充后數據;當所述樣本特征數據的數據類型為無序多分類型時,通過Softmax模型對所述樣本特征數據進行填充,得到填充后數據;當所述樣本特征數據的數據類型為有序多分類型時,通過有序多分類模型對所述樣本特征數據進行填充,得到填充后數據。
可選地,所述通過與所述樣本特征數據的數據類型相對應的機器學習模型對所述樣本特征數據進行填充,得到填充后數據,包括:獲取所述樣本特征數據中缺失率由低到高的數據位置排列順序;按照所述缺失率由低到高的數據位置排列順序,依次對缺失數據進行填充,得到填充后數據。
可選地,所述通過所述填充后數據對預設二分類模型進行訓練,得到訓練后模型,包括:通過預設切分點對所述標簽數據進行切分,并對分屬于預設切分點兩側的標簽數據分別進行二分類標記;通過所述填充后特征數據和進行二分類標記后的標簽數據對所述預設二分類模型進行訓練,得到訓練后數據。
可選地,當所述標簽數據的數據類型為連續型時,所述通過預設切分點對所述標簽數據進行切分之前,還包括:通過反向映射,將所述標簽數據轉換為sigmoid曲線;根據所述sigmoid曲線,確定所述標簽數據所對應的切分點,并將所確定的切分點確定為預設切分點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京貝殼時代網絡科技有限公司,未經北京貝殼時代網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010093501.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





