[發明專利]用于識別團伙的方法和系統有效
| 申請號: | 201910410330.0 | 申請日: | 2019-05-16 |
| 公開(公告)號: | CN110224859B | 公開(公告)日: | 2022-04-01 |
| 發明(設計)人: | 王川 | 申請(專利權)人: | 螞蟻智安安全技術(上海)有限公司 |
| 主分類號: | H04L41/12 | 分類號: | H04L41/12;H04L9/40;G06Q50/00;H04L51/52 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許振新;朱文杰 |
| 地址: | 200120 上海市浦東新區中國(上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 團伙 方法 系統 | ||
1.一種用于探索團伙的圖結構特征的方法,其特征在于,包括:
獲得多個用戶的用戶ID及所述多個用戶所使用的介質的介質ID之間的用戶介質關系集;
基于所述用戶介質關系集生成多個無向子圖,其中所述無向子圖的頂點表示用戶ID或介質ID,且連接所述用戶ID和所述介質ID的邊表示所述用戶使用所述介質ID;
基于所述多個無向子圖生成多個最大連通子圖;
確定所述多個最大連通子圖中的多個團伙子圖,所述多個團伙子圖包括多個已知團伙成員;以及
確定所述多個團伙子圖的圖結構特征;
所述方法還包括:
從數據庫接收第二數據集;
基于所述第二數據集生成第二用戶介質關系集;
基于所述第二用戶介質關系集生成第二多個無向子圖;
基于所述第二多個無向子圖生成第二多個最大連通子圖;
確定所述第二多個最大連通子圖中具有所述圖結構特征的最大連通子圖為潛在團伙子圖,其中所述潛在團伙子圖中的用戶ID被認為是潛在團伙成員。
2.如權利要求1所述的方法,其特征在于,所述方法還包括:
從數據庫接收樣本數據集,所述樣本數據集包括多個用戶的用戶身份以及活動信息,所述活動信息指示所述用戶所使用的介質的介質ID;以及
基于所述樣本數據集生成所述用戶介質關系集。
3.如權利要求1所述的方法,其特征在于,所述圖結構特征包括以下的一者或多者:用戶ID的閾值數量、介質ID的類別和閾值數量、邊的閾值數量。
4.如權利要求1所述的方法,其特征在于,所述方法還包括:
針對每個已知團伙成員,確定該已知團伙成員所屬的子圖;
確定該已知團伙成員所屬的子圖中的所有已知團伙成員的數量;以及
如果所述數量大于閾值數量,則確定該已知團伙成員所屬的子圖為團伙子圖。
5.如權利要求1所述的方法,其特征在于,所述方法還包括:
針對每個已知團伙成員,確定該已知團伙成員所屬的子圖;
確定該已知團伙成員所屬的子圖中的所有已知團伙成員的數量;
確定該已知團伙成員所屬的子圖中的所有用戶的數量;
計算該已知團伙成員所屬的子圖中的所有已知團伙成員的數量占所有用戶數量的比例;以及
如果所述比例大于閾值比例,則確定該已知團伙成員所屬的子圖為團伙子圖。
6.如權利要求1所述的方法,其特征在于,所述方法還包括:
基于對所述多個團伙子圖的統計來確定所述圖結構特征。
7.如權利要求6所述的方法,其特征在于,所述方法還包括以下的一者或多者:
確定所述多個團伙子圖中的用戶ID的數量的平均值或最小值來作為用戶ID的閾值數量;
確定所述多個團伙子圖中的數量最多的介質ID的類別作為介質ID的類別;
確定所述多個團伙子圖中的所述類別的介質ID的數量的平均值或最小值作為介質ID的閾值數量;以及
確定所述多個團伙子圖中的邊的數量的平均值或最小值作為邊的閾值數量。
8.如權利要求1所述的方法,其特征在于,所述團伙為賭博團伙、詐騙團伙或賣淫團伙。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于螞蟻智安安全技術(上海)有限公司,未經螞蟻智安安全技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910410330.0/1.html,轉載請聲明來源鉆瓜專利網。





