[發明專利]一種刷轉發量行為用戶的實時識別方法及裝置在審
| 申請號: | 202011353235.0 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112528162A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 王嘉偉 | 申請(專利權)人: | 微夢創科網絡科技(中國)有限公司 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06K9/62;G06Q50/00 |
| 代理公司: | 北京卓嵐智財知識產權代理事務所(特殊普通合伙) 11624 | 代理人: | 郭智 |
| 地址: | 100193 北京市海淀區東北旺西路中關村*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 轉發 行為 用戶 實時 識別 方法 裝置 | ||
1.一種刷轉發量行為用戶的實時識別方法,其特征在于,包括:
從全站所有的行為日志中提取出設定時間段內所有的轉發行為對應的轉發用戶、被轉發微博以及被轉發用戶;
通過第一矩陣記錄轉發用戶與被轉發用戶的轉發對應數據;通過第二矩陣記錄轉發用戶與被轉發微博的轉發對應數據;其中,第一矩陣的行向量記錄了每一轉發用戶對應于被轉發用戶發起轉發的數據,第二矩陣的行向量記錄每一轉發用戶對應于被轉發微博的轉發行為的數據;
分別對所述第一矩陣的行向量和第二矩陣的行向量進行聚類,獲得第一矩陣行向量聚族和第二矩陣行向量聚族;
遍歷第一矩陣行向量聚族,若聚族的平均發起轉發的數量大于第一設定轉發閾值,且聚族中的數據點的個數大于第一設定個數閾值,將該聚族中的轉發用戶加入第一集合;遍歷第二矩陣行向量聚族,若聚族的平均轉發行為的數量大于第二設定轉發閾值,且聚族中的數據點的個數大于第二設定個數閾值,將該聚族中的轉發用戶加入第二集合;
將存在于第一集合且存在于第二集合的轉發用戶確定為刷轉發量行為用戶。
2.如權利要求1所述的刷轉發量行為用戶的實時識別方法,其特征在于,所述通過第一矩陣記錄轉發用戶與被轉發用戶的轉發對應數據;通過第二矩陣記錄轉發用戶與被轉發微博的轉發對應數據,包括:
構建大小為n0*n1的全零矩陣M0和大小為n0*m的全零矩陣M1;其中,n0為所有轉發用戶的數量,n1為所有被轉發用戶的數量,m為所有被轉發微博的數量;
將所有的轉發用戶在矩陣M0和M1中進行行標記,將所有的被轉發用戶在矩陣M0中進行列標記,將所有的被轉發微博在矩陣M1中進行列標記;
將每一轉發行為對應的轉發用戶和被轉發用戶在M0中相應位置處的元素值加1,獲得第一矩陣;
將每一轉發行為對應的轉發用戶和被轉發微博在M1中相應位置處的元素值加1,獲得第二矩陣。
3.如權利要求2所述的刷轉發量行為用戶的實時識別方法,其特征在于,還包括:
如果判斷出第一矩陣的秩小于n0和n1的較小者、或者第二矩陣的秩小于n0和m的較小者,則在分別對所述第一矩陣的行向量和第二矩陣的行向量進行聚類之前,確認第一矩陣和第二矩陣均沒有全零行。
4.如權利要求3所述的刷轉發量行為用戶的實時識別方法,其特征在于,采用K-Means聚類方法對所述第一矩陣行向量和第二矩陣的行向量進行聚類。
5.如權利要求4所述的刷轉發量行為用戶的實時識別方法,其特征在于,所述第一設定轉發閾值大于第二設定轉發閾值,且第一設定個數閾值大于第二設定個數閾值。
6.一種刷轉發量行為用戶的實時識別裝置,其特征在于,包括:
數據獲取單元,用于從全站所有的行為日志中提取出設定時間段內所有的轉發行為對應的轉發用戶、被轉發微博以及被轉發用戶;
數據處理單元,用于通過第一矩陣記錄轉發用戶與被轉發用戶的轉發對應數據;通過第二矩陣記錄轉發用戶與被轉發微博的轉發對應數據;其中,第一矩陣的行向量記錄了每一轉發用戶對應于被轉發用戶發起轉發的數據,第二矩陣的行向量記錄每一轉發用戶對應于被轉發微博的轉發行為的數據;
聚類單元,用于分別對所述第一矩陣的行向量和第二矩陣的行向量進行聚類,獲得第一矩陣行向量聚族和第二矩陣行向量聚族;
數據提取單元,用于遍歷第一矩陣行向量聚族,若聚族的平均發起轉發的數量大于第一設定轉發閾值,且聚族中的數據點的個數大于第一設定個數閾值,將該聚族中的轉發用戶加入第一集合;遍歷第二矩陣行向量聚族,若聚族的平均轉發行為的數量大于第二設定轉發閾值,且聚族中的數據點的個數大于第二設定個數閾值,將該聚族中的轉發用戶加入第二集合;
確定單元,用于將存在于第一集合且存在于第二集合的轉發用戶確定為刷轉發量行為用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微夢創科網絡科技(中國)有限公司,未經微夢創科網絡科技(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011353235.0/1.html,轉載請聲明來源鉆瓜專利網。





