[發明專利]一種基于異常樣本的關聯規則挖掘方法、系統、終端及存儲介質有效
| 申請號: | 202110702650.0 | 申請日: | 2021-06-24 |
| 公開(公告)號: | CN113420069B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 蔣雪涵;孫行智 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F17/16 |
| 代理公司: | 深圳國新南方知識產權代理有限公司 44374 | 代理人: | 周雷 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 異常 樣本 關聯 規則 挖掘 方法 系統 終端 存儲 介質 | ||
1.一種基于異常樣本的關聯規則挖掘方法,其特征在于,包括:
獲取待挖掘樣本數據,所述待挖掘樣本數據包括正常樣本和異常樣本,且每個樣本中至少包括一個統計項目;
從所述待挖掘樣本數據中學習各個統計項目的共現條件概率,根據所述共現條件概率預測每個統計項目在各個樣本中的出現概率;
根據所述統計項目在各個樣本中的出現概率與所述統計項目在各個樣本中的真實出現情況計算各個樣本的異常分數,并根據所述異常分數將所述待挖掘樣本數據劃分為正常樣本和異常樣本;
采用關聯規則挖掘算法對所述正常樣本進行關聯規則挖掘,得到候選關聯規則;
計算所述候選關聯規則在異常樣本中的違反分數,通過所述違反分數對所述候選關聯規則進行篩選,得到最終的關聯規則;
所述采用關聯規則挖掘算法對所述正常樣本進行關聯規則挖掘,得到候選關聯規則具體為:
根據所述關聯規則挖掘算法的規則支持度和置信度標準,從所述正常樣本中挖掘出支持度和置信度高于設定閾值的關聯規則作為所述候選關聯規則;
所述計算所述候選關聯規則在異常樣本中的違反分數,通過所述違反分數對所述候選關聯規則進行篩選具體為:
將所述違反分數高于預設分數的關聯規則作為最終的關聯規則;其中,所述關聯規則的違反分數vlt_score越高,表示該關聯規則在異常樣本中的違反程度高于其在正常樣本中的違反程度。
2.根據權利要求1所述的基于異常樣本的關聯規則挖掘方法,其特征在于,所述獲取待挖掘樣本數據還包括:
獲取所述待挖掘樣本數據中各個樣本的統計項目出現矩陣X;所述統計項目出現矩陣X的尺寸為N*m,N為樣本的數量,m為所有統計項目的個數,統計項目出現矩陣X的每一行分別表示一個樣本,除第一列之外,所述統計項目出現矩陣X的每一列分別表示各統計項目是否在每個樣本中出現。
3.根據權利要求2所述的基于異常樣本的關聯規則挖掘方法,其特征在于,所述從所述待挖掘樣本數據中學習各個統計項目的共現條件概率,根據所述共現條件概率預測每個統計項目在各個樣本中的出現概率具體為:
將所述統計項目出現矩陣X輸入受限玻爾茲曼機網絡;
所述受限玻爾茲曼機網絡從所述統計項目出現矩陣X中學習各個統計項目的共現條件概率矩陣B;
根據所述共現條件概率矩陣B預測每個統計項目在各個樣本中的出現概率矩陣
4.根據權利要求3所述的基于異常樣本的關聯規則挖掘方法,其特征在于,所述根據所述統計項目在各個樣本中的出現概率與所述統計項目在各個樣本中的真實出現情況計算各個樣本的異常分數,并根據所述異常分數將所述待挖掘樣本數據劃分為正常樣本和異常樣本具體為:
分別計算各個樣本的統計項目出現矩陣X和概率矩陣的差平方和sample_abs;
將差平方和sample_abs的取值高于設定閾值的樣本劃分為異常樣本;
將差平方和sample_abs的取值低于設定閾值的樣本劃分為正常樣本,其中,所述差平方和的計算公式為:
5.根據權利要求1所述的基于異常樣本的關聯規則挖掘方法,其特征在于,所述違反分數vlt_score的計算公式為:
其中,L→R表示從所述正常樣本中得到的候選關聯規則,L為關聯規則的前件,表示規則起效的條件,R為關聯規則的后件,表示規則對應的結果,L的發生可推理出R的發生;ab_sup(L)表示所述異常樣本中出現L的概率,分母為異常樣本的數量,分子為異常樣本中出現L的樣本數量;ab_sup(L\R)表示所述異常樣本中出現L且不出現R的概率,分母為異常樣本中出現L的樣本數量,分子為所述異常樣本中出現L且不出現R的樣本數量;n_sup(L)表示所述正常樣本中出現L的概率,分母為正常樣本的數量,分子為正常樣本中出現L的樣本數量;n_sup(L\R)表示所述正常樣本中出現L且不出現R的概率,分母為正常樣本中出現L的樣本數量,分子為正常樣本中出現L且不出現R的樣本數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110702650.0/1.html,轉載請聲明來源鉆瓜專利網。





