[發明專利]風險數據篩選方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201811183701.8 | 申請日: | 2018-10-11 |
| 公開(公告)號: | CN109523118A | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 張翔;周欣欣;汪偉;肖京;高舒 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 王寧 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 風險數據 風險因子 風險評估結果 計算機設備 存儲介質 篩選 風險評估模型 初步篩選 二次篩選 金融行業 所屬數據 無效數據 大數據 預設 申請 應用 | ||
本申請涉及大數據技術領域,應用于金融行業,提供了一種風險數據篩選方法、裝置、計算機設備和存儲介質。方法包括:根據獲取的風險數據的所屬數據類別,確定風險數據指標的組成風險因子,獲得風險數據指標,將多個風險數據指標分別輸入預設風險評估模型,獲取風險評估結果差異大于設定范圍的風險數據指標組合,并將風險數據指標組合對應的風險數據的比較,確定有效風險因子,對風險數據進行篩選。通過風險數據類別,確定風險數據指標的組成風險因子,對風險數據進行了初步篩選得到風險數據指標,根據多個風險數據指標的風險評估結果,確定有效風險因子,實現了對風險數據的二次篩選,進而提高了風險數據的有效性,避免無效數據干擾風險評估結果。
技術領域
本申請涉及大數據技術領域,特別是涉及一種風險數據篩選方法、裝置、計算機設備和存儲介質。
背景技術
隨著企業多元化以及國際經營化的發展,越來越多的企業,對于企業自身的風險管控和預警日益看重,由于有效的風險預警有利于降低企業風險,減少利益損失。傳統的風險預警方法是根據研究對象的特點,通過收集相關資料信息,監控風險信號的變化趨勢,并評價各種風險狀態偏離預警閾值的強弱程度,向決策層發出預警信號并提前采取對策的系統。這些方法的核心技術通常為專家規則或機器學習算法。
然而,傳統的機器學習算法在進行風險數據篩選時往往是依據行業經驗,篩選得到的風險數據中可能存在部分無效數據,干擾風險預測結果。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高數據有效性的風險數據篩選方法、裝置、計算機設備和存儲介質。
一種風險數據篩選方法,所述方法包括:
獲取待篩選的風險數據,根據所述風險數據的所屬數據類別,確定風險數據指標的組成風險因子;
根據所述風險數據和所述組成風險因子,獲得所述風險數據指標;
將多個所述風險數據指標分別輸入預設風險評估模型,獲取所述風險評估結果差異大于設定范圍的風險數據指標組合,并獲取所述風險數據指標組合中各風險數據指標對應的組成風險因子集合;
比較所述組成風險因子集合對應的風險數據,根據比較結果確定有效風險因子;
根據所述有效風險因子,對所述風險數據進行篩選。
在其中一個實施例中,所述獲取待篩選的風險數據,根據所述風險數據的所屬數據類別,確定風險數據指標的組成風險因子包括:
獲取正樣本的風險數據和負樣本的風險數據,根據所述風險數據的所屬數據類別,對所述風險數據進行分類;
根據預設的評價參數,評價各類別的所述風險數據對于正樣本和負樣本的區分度;
根據所述區分度評價結果,確定所述風險數據指標的組成風險因子。
在其中一個實施例中,所述獲取待篩選的風險數據,根據所述風險數據的所屬數據類別,確定風險數據指標的組成風險因子之前,還包括:
獲取待處理數據,對所述待處理數據進行數據格式的歸一化處理;
對經過數據格式的歸一化處理的所述待處理數據進行數據清洗,獲得清洗數據;
對所述清洗數據進行衍生計算處理,獲得衍生數據;
根據預設閾值范圍,對所述清洗數據和所述衍生數據進行篩選,確定所述風險數據。
在其中一個實施例中,所述獲取待處理數據,對所述待處理數據進行數據格式的歸一化處理包括:
獲取所述待處理數據劃中的非結構化待處理數據,對所述非結構化待處理數據進行關鍵字提取和/或主題提取;
根據提取結果,將所述非結構化待處理數據轉換為結構化數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811183701.8/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





