[發明專利]基于復雜網絡的異常模式挖掘和增量式異常檢測方法在審
| 申請號: | 202011442440.4 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112527784A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 李子煜;劉雪莉;王文俊;吳斌 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/2458;G06F16/26;G06Q40/02 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 復雜 網絡 異常 模式 挖掘 增量 檢測 方法 | ||
1.基于復雜網絡的異常模式挖掘和增量式異常檢測方法,其特征在于,主要是應用于發現異常洗錢行為和非法集資行為,找出其運行的規律并進行可解釋性分析;
在挖掘異常賬戶時,可按照下面描述的步驟進行:
第一步:首先我們獲得銀行的交易數據;
第二步:對數據進行預處理;
第三步:根據五元組構建轉賬交易網絡;
第四步:使用頻繁模式挖掘算法挖掘正常轉賬模式;
第五步:加入自定義異常模式定義挖掘異常轉賬模式;
第六步:加入自定義人工經驗豐富異常模式庫;
第七步:針對網絡中不斷變化的情況,使用增量式模式檢測。
2.根據權利要求1所述的基于復雜網絡的異常模式挖掘和增量式異常檢測方法,其特征在于,根據交易關系,包含以下步驟:
a.首先對銀行內數據進行清洗選擇,交易關系的抽取,以及交易流水與客戶賬戶信息的對接,最后對涉及個人隱私的私密數據要進行篩除脫密處理;
b.將某個帶有標簽的網絡看作是一個五元組,G={V,E,ΣV,ΣE,L},其中,V表示網絡中節點的集合;表示網絡中邊的集合;ΣV和ΣE分別表示的是節點和邊的標簽的集合;L是標簽函數,V∪E→L,它的作用是完成標簽向節點和邊的映射,因此有:V→ΣV,E→ΣE;
c.下一步我們引入數據挖掘中的支持度來計算模式的出現頻率,采用基于圖像的最小支持度MNI作為評價指標,是基于單節點的支持度量,將MNI作為本算法的支持度來進行計算,來建模數據的分布;
給定一個網絡集合GD=(V,E),從GD中挖掘出的模式集合PD=(VP,EP),PD={Pi|i=1,2,…,n},如果模式P在G出現m次{f1,f2,...fm},MNI定義為:
σMNI(P,G)=min v∈VP|{fi(v):i=1,2,...,m}|
為了后續便于說明,直接將模式Pi的支持度記為SUPPi;
d.進行頻繁模式挖掘過程,進行擴展時遵循最右路徑擴展原則,每次擴展要更新模式的支持度SUPPi,計算方法使用GRAMI的CSP框架,此時計算的結果會大于真實值,使用當前的支持度SUPPi和給定的頻繁模式的支持度閾值suppσ1作比較:
若SUPPisuppσ1,則判定新模式不是頻繁模式,并對更新的該節點vi+1和邊進行剪枝;
若SUPPi≥suppσ1,那么將使用一系列啟發式算法進行計算,每次計算都會在CSP模式下計算當前的支持度,然后再次和閾值進行比較;
如果使用最后一個啟發式算法也不能排除是不是頻繁模式,那么就要完整計算此模式的具體支持度;
e.基于提出的頻繁模式挖掘算法GRAMI,利用該算法改進后的高效率來進行異常模式的挖掘和分析,提出異常模式挖掘算法AbGRAMI,由正常、頻繁,逐漸演變的過程中可能引入了一條新的邊或者是一個新的節點,使之變為異常情況;
f.基于已經挖掘出的異常模式集合APD,將根據異常模式的基礎上再加入一些人工經驗因素,豐富異常模式庫,生成異常模式集合APD+再次進行檢測;
g.使用AbGRAM的批處理算法一次計算APD,然后根據ΔG增量計算變化ΔAP。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011442440.4/1.html,轉載請聲明來源鉆瓜專利網。





