[發(fā)明專利]用于識別團(tuán)伙的方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201910410330.0 | 申請日: | 2019-05-16 |
| 公開(公告)號: | CN110224859B | 公開(公告)日: | 2022-04-01 |
| 發(fā)明(設(shè)計)人: | 王川 | 申請(專利權(quán))人: | 螞蟻智安安全技術(shù)(上海)有限公司 |
| 主分類號: | H04L41/12 | 分類號: | H04L41/12;H04L9/40;G06Q50/00;H04L51/52 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 許振新;朱文杰 |
| 地址: | 200120 上海市浦東新區(qū)中國(上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 識別 團(tuán)伙 方法 系統(tǒng) | ||
本申請涉及一種用于探索團(tuán)伙的圖結(jié)構(gòu)特征的方法,包括:獲得多個用戶的用戶ID及所述多個用戶所使用的介質(zhì)的介質(zhì)ID之間的用戶介質(zhì)關(guān)系集;基于所述用戶介質(zhì)關(guān)系集生成多個無向子圖,其中所述無向子圖的頂點表示用戶ID或介質(zhì)ID,且連接所述用戶ID和所述介質(zhì)ID的邊表示所述用戶使用所述介質(zhì)ID;基于所述多個無向子圖生成多個最大連通子圖;確定所述多個最大連通子圖中的多個團(tuán)伙子圖,所述多個團(tuán)伙子圖包括多個已知團(tuán)伙成員;以及確定所述多個團(tuán)伙子圖的圖結(jié)構(gòu)特征。本申請還涉及用于識別團(tuán)伙的方法。本申請能夠更高效準(zhǔn)確地識別團(tuán)伙。
技術(shù)領(lǐng)域
本說明書的一個或多個實施例涉及團(tuán)伙識別。
背景技術(shù)
隨著網(wǎng)絡(luò)的普及,尤其是網(wǎng)絡(luò)支付的廣泛應(yīng)用,一些網(wǎng)絡(luò)賭博、詐騙和賣淫活動也開始出現(xiàn)。而且,這些活動出現(xiàn)了聚集化的傾向。例如,在一些情況下,一些網(wǎng)絡(luò)聊天應(yīng)用或社交網(wǎng)絡(luò)應(yīng)用的多個用戶構(gòu)成賭博團(tuán)伙、詐騙團(tuán)伙和賣淫團(tuán)伙等。目前,已經(jīng)開發(fā)了一些方法來識別這些用戶。
然而,有些現(xiàn)有方法通常只能逐個識別這樣的用戶,而難以識別團(tuán)伙。另外一些現(xiàn)有方法雖然可能識別團(tuán)伙,但可能對抗性較差且效率不高。
因此,存在對于高效準(zhǔn)確地自動化識別團(tuán)伙的需要。
發(fā)明內(nèi)容
本說明書的一個或多個實施例通過以下技術(shù)方案來實現(xiàn)其上述目的。
在一個方面中,公開了一種用于探索團(tuán)伙的圖結(jié)構(gòu)特征的方法,包括:獲得多個用戶的用戶ID及所述多個用戶所使用的介質(zhì)的介質(zhì)ID之間的用戶介質(zhì)關(guān)系集;基于所述用戶介質(zhì)關(guān)系集生成多個無向子圖,其中所述無向子圖的頂點表示用戶ID或介質(zhì)ID,且連接所述用戶ID和所述介質(zhì)ID的邊表示所述用戶使用所述介質(zhì)ID;基于所述多個無向子圖生成多個最大連通子圖;確定所述多個最大連通子圖中的多個團(tuán)伙子圖,所述多個團(tuán)伙子圖包括多個已知團(tuán)伙成員;以及確定所述多個團(tuán)伙子圖的圖結(jié)構(gòu)特征。
優(yōu)選地,所述方法還包括:從數(shù)據(jù)庫接收樣本數(shù)據(jù)集,所述樣本數(shù)據(jù)集包括多個用戶的用戶身份以及活動信息,所述活動信息指示所述用戶所使用的介質(zhì)的介質(zhì)ID;以及基于所述樣本數(shù)據(jù)集生成所述用戶介質(zhì)關(guān)系集。
優(yōu)選地,所述圖結(jié)構(gòu)特征包括以下的一者或多者:用戶ID的閾值數(shù)量、介質(zhì)ID的類別和閾值數(shù)量、邊的閾值數(shù)量。
優(yōu)選地,所述方法還包括:針對每個已知團(tuán)伙成員,確定該已知團(tuán)伙成員所屬的子圖;確定該已知團(tuán)伙成員所屬的子圖中的所有已知團(tuán)伙成員的數(shù)量;以及如果所述數(shù)量大于閾值數(shù)量,則確定該已知團(tuán)伙成員所屬的子圖為團(tuán)伙子圖。
優(yōu)選地,所述方法還包括:針對每個已知團(tuán)伙成員,確定該已知團(tuán)伙成員所屬的子圖;確定該已知團(tuán)伙成員所屬的子圖中的所有已知團(tuán)伙成員的數(shù)量;確定該已知團(tuán)伙成員所屬的子圖中的所有用戶的數(shù)量;計算該已知團(tuán)伙成員所屬的子圖中的所有已知團(tuán)伙成員的數(shù)量占所有用戶數(shù)量的比例;以及如果所述比例大于閾值比例,則確定該已知團(tuán)伙成員所屬的子圖為團(tuán)伙子圖。
優(yōu)選地,所述方法還包括:基于對所述多個團(tuán)伙子圖的統(tǒng)計來確定所述圖結(jié)構(gòu)特征。
優(yōu)選地,所述方法還包括以下的一者或多者:確定所述多個團(tuán)伙子圖中的用戶ID的數(shù)量的平均值或最小值來作為用戶ID的閾值數(shù)量;確定所述多個團(tuán)伙子圖中的數(shù)量最多的介質(zhì)ID的類別作為介質(zhì)ID的類別;確定所述多個團(tuán)伙子圖中的所述類別的介質(zhì)ID的數(shù)量的平均值或最小值作為介質(zhì)ID的閾值數(shù)量;以及確定所述多個團(tuán)伙子圖中的邊的數(shù)量的平均值或最小值作為邊的閾值數(shù)量。
優(yōu)選地,所述團(tuán)伙為賭博團(tuán)伙、詐騙團(tuán)伙或賣淫團(tuán)伙。
優(yōu)選地,所述方法進(jìn)一步包括:從數(shù)據(jù)庫接收第二數(shù)據(jù)集;基于所述第二數(shù)據(jù)集生成第二用戶介質(zhì)關(guān)系集;基于所述第二用戶介質(zhì)關(guān)系集生成第二多個無向子圖;基于所述第二多個無向子圖生成第二多個最大連通子圖;確定所述第二多個最大連通自中中具有所述圖結(jié)構(gòu)特征的最大連通子圖為潛在團(tuán)伙子圖,其中所述潛在團(tuán)伙子圖中的用戶ID被認(rèn)為是潛在團(tuán)伙成員。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于螞蟻智安安全技術(shù)(上海)有限公司,未經(jīng)螞蟻智安安全技術(shù)(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910410330.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于人口信息庫與實名通話記錄的團(tuán)伙及其頭目識別方法
- 一種欺詐團(tuán)伙的識別方法和裝置
- 基于網(wǎng)絡(luò)流量的詐騙團(tuán)伙識別方法、控制器和介質(zhì)
- 目標(biāo)數(shù)據(jù)庫構(gòu)建方法、目標(biāo)申請人識別方法及裝置、系統(tǒng)
- 團(tuán)伙挖掘方法、異常團(tuán)伙的識別方法、裝置及電子設(shè)備
- 一種車險欺詐團(tuán)伙識別方法及裝置
- 訂單信息的處理方法、設(shè)備、存儲介質(zhì)及計算機程序產(chǎn)品
- 一種套現(xiàn)團(tuán)伙嚴(yán)重等級劃分方法及系統(tǒng)
- 實時風(fēng)險團(tuán)伙的識別方法、介質(zhì)、裝置和計算設(shè)備
- 團(tuán)伙識別模型的訓(xùn)練方法、異常團(tuán)伙識別方法及裝置





