[發明專利]一種風險規則提取方法及風險規則提取裝置在審
| 申請號: | 201911097202.1 | 申請日: | 2019-11-11 |
| 公開(公告)號: | CN112785112A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 段戎;黃文文;潘柱新 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 風險 規則 提取 方法 裝置 | ||
本申請實施例公開了一種風險規則提取方法及風險規則提取裝置,涉及計算機數據挖掘領域,能夠輸出多變量的風險規則,能夠滿足多種風控業務的需求。包括:獲取N組樣本數據;所述N組樣本數據中任意一組樣本數據包括M個變量對應的屬性值;所述N為大于等于2的整數,所述M為大于等于2的整數;利用自動編碼算法、關聯規則算法對所述N組樣本數據進行處理,確定X個變量;所述X個變量對應的樣本數據的風險系數大于第一閾值且所述X個變量的關聯度大于第二閾值;所述X個變量屬于所述M個變量,所述X為小于等于所述M的整數;根據所述X個變量確定風險規則,所述風險規則用于指示所述X個變量導致風險事件所滿足的條件。
技術領域
本申請實施例涉計算機數據挖掘領域,尤其涉及一種風險規則提取方法及風險規則提取裝置。
背景技術
目前,很多業務場景中需要進行風險檢測,例如財務報銷異常檢測,網絡入侵檢測,信用卡盜刷檢測,健康風險檢測、產品缺陷檢測等等。具體地,輸入樣本數據后,利用已知規則對輸入的樣本數據進行異常識別,輸出不符合已知規則的異常樣本數據。此外,還可以對異常樣本數據進行學習,生成單變量的風險規則,即由一個變量導致風險的規則。
現有技術中,依賴于某個業務的已知規則識別風險,只能面向單一的業務場景,無法靈活應用在其他業務場景中。另外,現有技術只能提取單變量的風險規則,單變量的規則過濾能力偏低,無法適應場景的多樣性,不能滿足日益復雜的風控業務需求。
發明內容
本申請實施例提供一種風險規則提取方法及風險規則提取裝置,能夠輸出多變量的風險規則,能夠滿足多種風控業務的需求。
為達到上述目的,本申請實施例采用如下技術方案:
第一方面,提供了一種風險規則提取方法,包括:首先獲取N組樣本數據;N組樣本數據中任意一組樣本數據包括M個變量對應的屬性值;N為大于等于2的整數,M為大于等于2的整數;還可以利用自動編碼算法、關聯規則算法對N組樣本數據進行處理,確定X個變量;X個變量對應的樣本數據的風險系數大于第一閾值且X個變量的關聯度大于第二閾值;X個變量屬于M個變量,X為小于等于M的整數;最后,可以根據X個變量確定風險規則,風險規則用于指示X個變量導致風險事件所滿足的條件。
本申請實施例提供一種風險規則提取方法,首先獲取N組樣本數據;其中,一組樣本數據包括M個變量對應的屬性值。隨后,還可以利用自動編碼(AE)算法、關聯規則算法對上述N組樣本數據進行處理,確定X個高風險且關聯度較大的變量,最后根據這X個變量確定風險規則,所述風險規則用于指示所述X個變量導致風險事件所滿足的條件。本申請實施例提供的方法中,可以根據自動編碼算法對樣本數據進行學習確定風險較大的樣本數據(即風險系數大于第一閾值),還可以利用關聯規則算法學習高風險的樣本數據確定上述強關聯的多個變量,根據高風險樣本數據確定的強關聯的變量可能導致風險,因此最終可以輸出強關聯的多個變量構成的多變量風險規則。通過提取風險規則,可以為風險檢測結果的解釋提供依據。同時,本申請實施例可以提取多變量的風險規則,可以覆蓋各種風險場景,相對于單變量風險規則,過濾能力較高,可以滿足日益復雜的風控業務需求。
結合第一方面,利用自動編碼算法、關聯規則算法對N組樣本數據進行處理,確定X個變量,包括:
首先可以根據AE模型的神經元的權重系數確定M個變量的重要性系數,篩選出重要性系數大于第三閾值的T個變量,即重要變量;還可以利用自動編碼算法確定N組樣本數據中風險系數大于第一閾值的S組樣本數據,且S組樣本數據僅包括T個變量對應的屬性值;利用關聯規則算法處理S組樣本數據,確定T個變量中關聯度大于第二閾值的X個變量。
本申請實施例提供的方法中,可以利用AE模型對輸入的樣本數據進行學習,獲得高風險的樣本數據,并且可以去除樣本數據中的非重要變量。此外,還可以利用關聯規則算法處理AE模型的輸出,確定多個強關聯的高風險變量,從而可以創建多變量的風險規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911097202.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據獲取方法、裝置以及計算機存儲介質
- 下一篇:一種食用菌培育方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





