[發(fā)明專利]異常賬號檢測方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010528245.7 | 申請日: | 2020-06-11 |
| 公開(公告)號: | CN111698247B | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設(shè)計)人: | 劉志煌 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06K9/62 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 趙翠萍;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 異常 賬號 檢測 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請實施例提供了一種異常賬號檢測方法、裝置、設(shè)備及存儲介質(zhì);所述方法包括:確定表征賬號集合中賬號特征的序列集合;根據(jù)所述賬號集合中的賬號總數(shù)和每一序列在所述賬號集合中出現(xiàn)的序列次數(shù),確定所述每一序列的支持度;根據(jù)所述每一序列的支持度,對所述賬號集合中的賬號進行聚類,得到聚類結(jié)果;確定所述聚類結(jié)果的每一類別中所述異常賬號樣本的占比;將所述異常賬號樣本的占比大于等于占比閾值的類別中的待檢測賬號,確定為異常賬號;這樣,通過確定異常賬號樣本在類別中的分布進行異常賬號識別,能夠了降低異常賬號樣本較少對分類效果的影響,提高了檢測的準確度。
技術(shù)領(lǐng)域
本申請涉及計算機領(lǐng)域,尤其涉及異常賬號檢測方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
基于行為特征或賬號內(nèi)容進行分類檢測,對異常賬號進行檢測的過程中,需要標注較多的異常賬號樣本,同時由于異常賬號和正常賬號的數(shù)量差異較大,異常賬號樣本特征不容易被學習到,影響檢測結(jié)果的準確度。
發(fā)明內(nèi)容
本申請實施例提供一種異常賬號檢測方法、裝置、設(shè)備及存儲介質(zhì),通過確定異常賬號樣本在類別中的分布進行異常賬號識別,能夠了降低異常賬號樣本較少對分類效果的影響,提高了檢測的準確度。
本申請實施例的技術(shù)方案是這樣實現(xiàn)的:
第一方面,本申請實施例提供一種異常賬號檢測方法,包括:
確定表征賬號集合中賬號特征的序列集合;其中,所述賬號集合包括至少一個異常賬號樣本和至少一個待檢測賬號;
根據(jù)所述賬號集合中的賬號總數(shù)和每一序列在所述賬號集合中出現(xiàn)的序列次數(shù),確定所述每一序列的支持度;
根據(jù)所述每一序列的支持度,對所述賬號集合中的賬號進行聚類,得到聚類結(jié)果;
確定所述聚類結(jié)果的每一類別中所述異常賬號樣本的占比;
將所述異常賬號樣本的占比大于等于占比閾值的類別中的待檢測賬號,確定為異常賬號。
第二方面,本申請實施例提供一種異常賬號檢測裝置,所述裝置包括:
第一確定模塊,用于確定表征賬號集合中賬號特征的序列集合;其中,所述賬號集合包括至少一個異常賬號樣本和至少一個待檢測賬號;
第二確定模塊,用于根據(jù)所述賬號集合中的賬號總數(shù)和每一序列在所述賬號集合中出現(xiàn)的序列次數(shù),確定所述每一序列的支持度;
第一聚類模塊,用于根據(jù)所述每一序列的支持度,對所述賬號集合中的賬號進行聚類,得到聚類結(jié)果;
第一占比模塊,用于確定所述聚類結(jié)果的每一類別中所述異常賬號樣本的占比;
第一檢測模塊,用于將所述異常賬號樣本的占比大于等于占比閾值的類別中的待檢測賬號,確定為異常賬號。
第三方面,本申請實施例提供一種異常賬號檢測的設(shè)備,包括:存儲器,用于存儲可執(zhí)行指令;處理器,用于執(zhí)行所述存儲器中存儲的可執(zhí)行指令時,實現(xiàn)上述異常賬號檢測方法。
第四方面,本申請實施例提供一種存儲介質(zhì),存儲有可執(zhí)行指令,用于引起處理器執(zhí)行時,實現(xiàn)本申請實施例提供的異常賬號檢測方法。
本申請實施例具有以下有益效果:首先,對賬號集合中的賬號進行序列提取,然后,通過確定每一序列的支持度,對賬號進行聚類;這樣,通過對賬號的特征進行聚類,能夠基于少量的異常賬號樣本實現(xiàn)異常賬號識別;最后,通過判斷每一列表中異常賬號樣本的占比,將異常賬號樣本占比較大的類別中的待檢測賬號,確定為異常賬號;這樣,通過確定異常賬號樣本在類別中的分布進行異常賬號識別,能夠降低異常賬號樣本較少、正負樣本嚴重不均衡造成的對分類效果的影響,提高了檢測的準確度。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010528245.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





