[發明專利]一種稠密多部子圖的檢測方法及系統在審
| 申請號: | 202010071390.7 | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111291229A | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 劉盛華;石川;程學旗;李香峰;沈華偉;劉財政 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/9035;G06Q40/04 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 稠密 多部子圖 檢測 方法 系統 | ||
本發明提出一種基于稠密多部子圖的檢測方法及系統,包括:步驟1、根據鏈式特征中的信息流動,構建交易網絡的多部圖,根據預設的賬戶間信息流動閾值篩選該多部圖,得到該多部圖中的稠密子圖;步驟2、以固定賬戶存在超閾值的信息流且在中間賬戶中保留低于閾值的權重為約束條件,生成該稠密子圖中節點子集的異常值;步驟3、根據該異常值,輸出該多部圖中存在異常行為的節點子集作為異常行為檢測結果。本發明通過具有有效性和魯棒性和良好的可擴展性。
技術領域
本發明涉及數據挖掘領域,特別涉及一種稠密多部子圖的檢測方法及系統。
背景技術
隨著互聯網的發展,互聯網應用獲得了飛速發展,社交媒體也獲得了飛速 發展,目前社交媒體已超越搜索引擎,成為互聯網第一大流量來源,二者占比 分別為46%和40%。而隨著技術的發展,惡意話題操作以及洗錢等也成為了 不法分子的謀取暴力的工具。惡意話題炒作是一些團伙通過相互轉發信息來炒 作某個話題,從而獲得輿論影響力、宣傳推廣等目的;互洗錢是將從非法來源 獲得的資金轉化為合法資金的過程。圖成為一種常見數據應用到許多科學和工 程中,圖可以表示成這樣一種結構,即圖G=(V,E)是一對集合:一組頂點 V表示實體和一組邊E表示實體之間的關系或連接。在計算機科學中,網絡包含節點和邊緣;而在社會科學中,相應的術語則是行為者和關系,在本文中這 兩個術語具有同等意義。如果用圖中的頂點表示參與活動的人,用邊表示消息 或者人與人之間的關聯。那么當發起媒體炒作或者洗錢行為時,會在特定時間 或者特定常見下,參與活動的人之間產生一個多部稠密子圖。用戶之間的相互 關注關系就構成了社交網絡圖,其常見的存儲格式是鄰接矩陣或者拉普拉斯矩 陣,鄰接矩陣如圖1所示,當兩個節點之間右邊相連時,對應的位置置為1, 如果兩個節點之間無邊相連,對應的位置置為0,如果是有權圖,對應位置置 為權值,無邊相連對應位置置為極大的值,但是其特征幾乎相同。
圖2顯示了一個洗錢的案例,包含從源賬戶到中間賬戶到目標賬戶的兩步 資金轉移流程。為了隱藏資金的真實來源和去向,洗錢者往往通過多層中間賬 戶(可以是銀行內或銀行間轉賬)隱秘的將臟錢從源賬戶轉移到目的賬戶。銀 行轉賬日志中只記錄了自己銀行中的賬戶的交易記錄,包括從外部賬戶轉入、 從銀行賬戶轉出和銀行賬戶之間的轉賬記錄。由于不太可能從每個銀行得到轉 賬日志,因此洗錢檢測問題通常集中在如何利用單個銀行的轉賬日志上。實際 上,現有的度量和算法通常足以使用單個銀行的交易記錄或者來自多個銀行的 聯合交易記錄來進行洗錢檢測。下文使用“銀行”來代指進行洗錢檢測的銀行 或者多個銀行集合。一般而言,洗錢流程包括三步:a)在銀行開戶若干中間 賬戶;b)從其他銀行開戶的源賬戶轉賬到中間賬戶;c)將錢從中間賬戶匯集 到若干不同的目的地賬戶。洗錢行為具有兩個主要特征,第一個特征是密集轉 賬。洗錢者創建了一個密集的高容量轉賬子圖,無論是在資金流入銀行還是流 出銀行的時候。這是因為欺詐賬戶的數量有限,并且需要在短時間內將大量資 金轉入銀行并轉出銀行,從而產生了密集的高容量轉賬子圖。第二個特征是中 間賬戶的賬戶余額基本為零。中間賬戶在洗錢過程中充當了資金橋的作用:大 部分流入的資金都將被轉出,從而使得流入流出資金基本相等,賬戶余額為零。這是因為洗錢者留在中間賬戶中的錢會有被檢測和凍結的風險。因此,欺詐者 往往在中間賬戶中留下盡可能少的錢。
當前對于多部稠密子圖檢測的方法包括:
第一是是基于規則的分類。這些規則基于本體的專家系統來檢測可疑交易; 使用基于規則設計的貝葉斯網絡來評估客戶的交易行為的風險指數。
第二是基于機器學習算法來檢測。這些方法包括SVM、決策樹、RBF神經 網絡等。
第三是通用的基于圖的異常檢測算法。這些檢測方法主要基于圖來檢測洗 錢行為。具體包括研究特征向量中的模式,基于消息傳播以及基于稠密子圖等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010071390.7/2.html,轉載請聲明來源鉆瓜專利網。





