[發明專利]一種刷轉發量行為用戶的實時識別方法及裝置在審
| 申請號: | 202011353235.0 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112528162A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 王嘉偉 | 申請(專利權)人: | 微夢創科網絡科技(中國)有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06K9/62;G06Q50/00 |
| 代理公司: | 北京卓嵐智財知識產權代理事務所(特殊普通合伙) 11624 | 代理人: | 郭智 |
| 地址: | 100193 北京市海淀區東北旺西路中關村*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 轉發 行為 用戶 實時 識別 方法 裝置 | ||
本發明實施例提供一種刷轉發量行為用戶的實時識別方法及裝置,其中,所述方法包括:獲取所有的轉發行為對應的轉發用戶、被轉發微博以及被轉發用戶;通過第一矩陣和第二矩陣分別記錄轉發用戶與被轉發用戶以及被轉發微博的轉發對應數據;通過聚類,獲得第一矩陣行向量聚族和第二矩陣行向量聚族;遍歷第一矩陣行向量聚族和第二矩陣行向量聚族,將滿足條件的第一矩陣行向量聚族中的轉發用戶加入第一集合,滿足條件的第二矩陣行向量聚族中的轉發用戶加入第二集合;共存于第一集合和第二集合的轉發用戶即為刷轉發量行為用戶。根據本發明的技術方案,不僅能識別出發起大量轉發的不法分子帳號,還能盡量減小誤傷,增加查出率。
技術領域
本發明涉及數據處理領域,具體涉及一種刷轉發量行為用戶的實時識別方法及裝置。
背景技術
在現代的社交媒體的互聯網社交平臺中,轉發是一種非常重要的社交活動。于是出現大量不法分子利用腳本批量的刷轉發量,甚至還出現了專門刷轉發量的黑色產業鏈,這些非法的轉發行為稱為批量轉發或者刷轉發量。刷轉發是對普通用戶和對平臺都不利的,要想辦法找出來。
現有技術實時的接收轉發日志,并記錄一定時間內個發起關注的ip地址及其對應轉發次數,對轉發次數大于某閾值的ip認為它發起的所有轉發都是刷轉發。雖說簡單有效,但容易被繞過,也容易誤傷公共ip用戶的轉發行為。
發明內容
本發明實施例提供一種刷轉發量行為用戶的實時識別方法及裝置,不僅能識別出發起大量轉發的不法分子帳號,還能盡量減小誤傷,增加查出率。
為達到上述目的,一方面,本發明實施例提供了一種刷轉發量行為用戶的實時識別方法,所述方法包括:
從全站所有的行為日志中提取出設定時間段內所有的轉發行為對應的轉發用戶、被轉發微博以及被轉發用戶;
通過第一矩陣記錄轉發用戶與被轉發用戶的轉發對應數據;通過第二矩陣記錄轉發用戶與被轉發微博的轉發對應數據;其中,第一矩陣的行向量記錄了每一轉發用戶對應于被轉發用戶發起轉發的數據,第二矩陣的行向量記錄每一轉發用戶對應于被轉發微博的轉發行為的數據;
分別對所述第一矩陣的行向量和第二矩陣的行向量進行聚類,獲得第一矩陣行向量聚族和第二矩陣行向量聚族;
遍歷第一矩陣行向量聚族,若聚族的平均發起轉發的數量大于第一設定轉發閾值,且聚族中的數據點的個數大于第一設定個數閾值,將該聚族中的轉發用戶加入第一集合;遍歷第二矩陣行向量聚族,若聚族的平均轉發行為的數量大于第二設定轉發閾值,且聚族中的數據點的個數大于第二設定個數閾值,將該聚族中的轉發用戶加入第二集合;
將存在于第一集合且存在于第二集合的轉發用戶確定為刷轉發量行為用戶。
另一方面,本發明實施例提供了一種刷轉發量行為用戶的實時識別裝置,所述裝置包括:
數據獲取單元,用于從全站所有的行為日志中提取出設定時間段內所有的轉發行為對應的轉發用戶、被轉發微博以及被轉發用戶;
數據處理單元,用于通過第一矩陣記錄轉發用戶與被轉發用戶的轉發對應數據;通過第二矩陣記錄轉發用戶與被轉發微博的轉發對應數據;其中,第一矩陣的行向量記錄了每一轉發用戶對應于被轉發用戶發起轉發的數據,第二矩陣的行向量記錄每一轉發用戶對應于被轉發微博的轉發行為的數據;
聚類單元,用于分別對所述第一矩陣的行向量和第二矩陣的行向量進行聚類,獲得第一矩陣行向量聚族和第二矩陣行向量聚族;
數據提取單元,用于遍歷第一矩陣行向量聚族,若聚族的平均發起轉發的數量大于第一設定轉發閾值,且聚族中的數據點的個數大于第一設定個數閾值,將該聚族中的轉發用戶加入第一集合;遍歷第二矩陣行向量聚族,若聚族的平均轉發行為的數量大于第二設定轉發閾值,且聚族中的數據點的個數大于第二設定個數閾值,將該聚族中的轉發用戶加入第二集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微夢創科網絡科技(中國)有限公司,未經微夢創科網絡科技(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011353235.0/2.html,轉載請聲明來源鉆瓜專利網。





