[發明專利]基于復雜網絡的異常模式挖掘和增量式異常檢測方法在審
| 申請號: | 202011442440.4 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112527784A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 李子煜;劉雪莉;王文俊;吳斌 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/2458;G06F16/26;G06Q40/02 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 復雜 網絡 異常 模式 挖掘 增量 檢測 方法 | ||
本發明公開基于復雜網絡的異常模式挖掘和增量式異常檢測方法,主要是應用于發現異常洗錢行為和非法集資行為,找出其運行的規律并進行可解釋性分析;在挖掘異常賬戶時,可按照下面描述的步驟進行:首先我們獲得銀行的交易數據;對數據進行預處理;根據五元組構建轉賬交易網絡;使用頻繁模式挖掘算法挖掘正常轉賬模式;加入自定義異常模式定義挖掘異常轉賬模式;加入自定義人工經驗豐富異常模式庫;針對網絡中不斷變化的情況,使用增量式模式檢測。
技術領域
本發明屬于數據挖掘領域,是一種基于復雜網絡的異常模式挖掘和增量式異常檢測方法, 然后根據不同賬戶之間的轉賬交易關系構建交易關系網絡,根據此網絡挖掘交易信息中異常 洗錢和非法集資的賬戶。
背景技術
銀行和保險公司每年因欺詐而損失數十億美元。面對欺詐行為,銀行往往會使用一些傳 統的統計方法來設置用戶操作的風險等級制度,或是判斷一些操作是否符合常理等,來規避 一些潛在的風險因素,但是欺詐者會通過各種復雜的方法來逃避發現。由于圖模式挖掘算法 有很好可解釋性,且目前還未有將圖模式挖掘算法應用到銀行異常行為檢測中。本發明通過 建立起現實世界中的“人(用戶)-事(交易)”關系模型,來具體研究異常模式檢測。本發 明提出一個異常賬戶挖掘檢測框架,它為處理傳統的基于數據庫記錄的難以分析的數據提供 了新的方法,以圖模式挖掘為主導方法,異常模式檢測為實際問題,研究異常模式挖掘算法 在銀行交易可能產生的異常行為。將數據庫中的轉賬交易事件表構建成網絡,通過對網絡的 結構和屬性特征分析并挖掘異常模式進行規律分析,為商業銀行異常賬戶判定提出指導意見。
發明內容
本發明使用圖模式挖掘算法挖掘出異常模式,發現一些使用傳統方法難以檢測的模式, 找到發生異常的用戶,并在銀行現有的業務數據基礎之上,通過數據挖掘技術,發現圖約束 規則,建立異常模式智庫。本文的最終目的即在利用銀行海量數據構建的融合多元屬性的銀 行復雜網絡的基礎上,針對商業銀行的異常轉賬行為通過異常模式挖掘和增量式異常檢測, 為銀行科學的制定經營策略提供具有實用性和價值性的意見,具有一定的理論意義和應用價 值。
本發明的技術方案是基于復雜網絡的異常模式挖掘和增量式異常檢測方法,主要是應用 于發現異常洗錢行為和非法集資行為,找出其運行的規律并進行可解釋性分析;
在挖掘異常賬戶時,可按照下面描述的步驟進行:
第一步:首先我們獲得銀行的交易數據;
第二步:對數據進行預處理;
第三步:根據五元組構建轉賬交易網絡;
第四步:使用頻繁模式挖掘算法挖掘正常轉賬模式;
第五步:加入自定義異常模式定義挖掘異常轉賬模式;
第六步:加入自定義人工經驗豐富異常模式庫;
第七步:針對網絡中不斷變化的情況,使用增量式模式檢測。
根據交易關系,包含以下步驟:
a.首先對銀行內數據進行清洗選擇,交易關系的抽取,以及交易流水與客戶賬戶信息的對 接,最后對涉及個人隱私的私密數據要進行篩除脫密處理;
b.將某個帶有標簽的網絡看作是一個五元組,G={V,E,ΣV,ΣE,L},其中,V表示網絡 中節點的集合;表示網絡中邊的集合;ΣV和ΣE分別表示的是節點和邊的標簽的集 合;L是標簽函數,V∪E→L,它的作用是完成標簽向節點和邊的映射,因此有:V→ΣV,E→ΣE; c.下一步我們引入數據挖掘中的支持度來計算模式的出現頻率,采用基于圖像的最小支持 度MNI作為評價指標,是基于單節點的支持度量,將MNI作為本算法的支持度來進行計算, 來建模數據的分布;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011442440.4/2.html,轉載請聲明來源鉆瓜專利網。





