[發明專利]異常賬號檢測方法、裝置、設備及存儲介質有效
| 申請號: | 202010528245.7 | 申請日: | 2020-06-11 |
| 公開(公告)號: | CN111698247B | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 劉志煌 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 趙翠萍;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 異常 賬號 檢測 方法 裝置 設備 存儲 介質 | ||
1.一種異常賬號檢測方法,其特征在于,所述方法包括:
確定表征賬號集合中賬號特征的序列集合;其中,所述賬號集合包括至少一個異常賬號樣本和至少一個待檢測賬號;
根據每一序列在所述賬號集合中出現的序列次數和所述賬號集合中的賬號總數的比值,確定所述每一序列的支持度;
根據所述支持度與預設的最小支持度之間的大小關系,確定所述序列集合中的頻繁序列和非頻繁序列,并確定所述頻繁序列和所述非頻繁序列的權重;
基于所述頻繁序列和所述非頻繁序列的權重,計算所述賬號集合中的賬號的權重,并根據賬號的權重對所述賬號集合中的賬號加權聚類,得到聚類結果;
確定所述聚類結果的每一類別中所述異常賬號樣本的占比;
將所述異常賬號樣本的占比大于等于占比閾值的類別中的待檢測賬號,確定為異常賬號。
2.根據權利要求1所述的方法,其特征在于,所述確定表征賬號集合中賬號特征的序列集合,包括:
對所述賬號集合中的賬號進行特征提取,得到賬號特征集合;
對所述賬號特征集合中滿足條件的特征進行處理,得到更新特征集合;
按照至少一個預設前綴特征長度,對所述更新特征集合中的更新特征進行至少一次劃分,得到所述序列集合。
3.根據權利要求2所述的方法,其特征在于,所述對所述賬號特征集合中滿足條件的特征進行處理,得到更新特征集合,包括:
根據所述賬號特征集合中的賬號特征的描述信息,對所述賬號特征集合中的賬號特征進行分類;
確定每一類別的賬號特征的特征值;
將同一類別的賬號特征中,特征值大于所述類別相匹配的特征閾值的特征進行過濾,得到所述更新特征集合。
4.根據權利要求2所述的方法,其特征在于,所述對所述賬號特征集合中滿足條件的特征進行處理,得到更新特征集合,包括:
確定所述賬號集合中每一賬號缺失的所述賬號特征集合中的缺失特征;
確定所述缺失特征的特征值所屬的數據類型;
采用與所述數據類型相匹配的預設特征值,對所述缺失特征進行填充,得到所述更新特征集合。
5.根據權利要求4所述的方法,其特征在于,所述采用與所述數據類型相匹配的預設特征值,對所述缺失特征進行填充,得到所述更新特征集合,包括:
如果所述缺失特征的特征值為離散型,采用預設常數進行填充,得到所述更新特征集合;
或者,
如果所述缺失特征的特征值為連續型特征,確定所述缺失特征的特征值在所述賬號特征集合中的平均值;采用所述平均值對所述缺失特征進行填充,得到所述更新特征集合。
6.根據權利要求1所述的方法,其特征在于,所述確定所述頻繁序列和所述非頻繁序列的權重,包括:
將所述頻繁序列的支持度確定為所述頻繁序列的第一權重;
根據所述賬號集合中包括所述非頻繁序列的賬號數量和賬號總數,確定所述非頻繁序列的第二權重。
7.根據權利要求1所述的方法,其特征在于,所述根據賬號的權重對所述賬號集合中的賬號加權聚類,得到聚類結果,包括:
根據所述賬號集合中的每一賬號的賬號特征,確定至少兩個賬號之間的相似度;
將相似度大于相似度閾值的至少兩個賬號,劃分為同一類別的賬號;
采用所述同一類別的賬號的權重,一一對應地對所述同一類別的賬號進行加權并求和,以得到所述聚類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010528245.7/1.html,轉載請聲明來源鉆瓜專利網。





