[發明專利]社交媒體流量的水分流量處理方法、系統及設備有效
| 申請號: | 201910567614.0 | 申請日: | 2019-06-27 |
| 公開(公告)號: | CN110287322B | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 孔曉晴;李百川;蔡銳濤 | 申請(專利權)人: | 有米科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/958;G06F17/18;G06Q50/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 古利蘭 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社交 媒體 流量 水分 處理 方法 系統 設備 | ||
本發明提供一種社交媒體流量的水分流量處理方法、系統及設備,該方法為:獲取多個待分析博主的賬號信息和在預設周期內發布的每條內容對應的流量數據。基于待分析博主的賬號信息,對待分析博主進行分類,得到多組博主列表。針對每一博主列表,對博主列表中的所有內容進行正態性檢驗,確定博主列表中的所有內容是否符合正態分布。根據檢驗結果,對博主列表中的所有內容進行一元離群點檢測或異常檢測,得到每條內容的流量數據中的水分流量。根據每一博主列表中每條內容的水分流量,計算每一博主列表中每個待分析博主的水分流量。本方案中,通過博主的內容和內容的流量數據評估博主的水分流量,獲取博主相關信息的難度低、評估成本低和準確性高。
技術領域
本發明涉及數據處理技術領域,具體涉及一種社交媒體流量的水分流量處理方法、系統及設備。
背景技術
隨著互聯網的發展,社交媒體軟件逐漸成為人們日常生活中重要的組成部分。用戶在社交媒體軟件上發布各式各類的內容,以供其他用戶進行瀏覽,因此信息通過社交媒體軟件可以得到快速的傳播和推廣。
在社交媒體軟件中,一些用戶為了增加自身的影響力或者為了實現某種目的,會雇傭俗稱“網絡水軍”的用戶來發表和傳播大量特定的消息,以達到增加轉發量和評論量等目的。但是,絕大部分網絡水軍通常為機器人賬號,在轉發和傳播信息時,接收到該信息的真實用戶量較少,信息傳播質量低下以及無法準確判斷用戶的真實影響力。因此需要評估用戶的粉絲中網絡水軍的占比數量,從而評估用戶的網絡流量中的水分流量。
目前評估用戶的粉絲中網絡水軍的占比數量的方式為:預先設置多種水軍特征,獲取用戶的粉絲和評論者的詳細信息,若該用戶的粉絲或評論者的信息符合多種水軍特征中預設數量的水軍特征,則說明該粉絲或評論者為網絡水軍。但是,第一方面,制造水軍的策略在不斷發生變化,需要人為不斷更新預設的水軍特征才能保證評估水軍的準確性,更新成本較高。第二方面,在評估水軍時,需要獲取用戶的全部粉絲和評論者的詳細信息,獲取難度較大。第三方面,有些真實用戶的日常行為有可能符合多項水軍特征,因此容易將真實用戶誤判為水軍,評估水軍的準確性較低。
發明內容
有鑒于此,本發明實施例提供一種社交媒體流量的水分流量處理方法、系統及設備,以解決目前評估水軍的方法存在的更新水軍特征成本較高、獲取粉絲和評論者詳細信息的難度較大和評估準確性低等問題。
為實現上述目的,本發明實施例提供如下技術方案:
本發明實施例第一方面公開了一種社交媒體流量的水分流量處理方法,所述方法包括:
獲取多個待分析博主的賬號信息;
獲取每個所述待分析博主在預設周期內發布的每條內容對應的流量數據,其中,所述流量數據至少包括:每條內容的點擊數和獲取所述點擊數時所述待分析博主的粉絲數,所述點擊數包括轉發數或播放量;
基于每個所述待分析博主的賬號信息,對所述多個待分析博主進行分類,得到多組博主列表,其中,一組博主列表對應一類別博主;
針對每一組所述博主列表,對所述博主列表中所有待分析博主的所有內容進行正態性檢驗,確定所述博主列表中的所有內容是否符合正態分布;
若所述博主列表中的所有內容符合正態分布,對所述博主列表中的所有內容進行一元離群點檢測,得到每條內容的流量數據中的水分流量;
若所述博主列表中的所有內容不符合正態分布,對所述博主列表中的所有內容進行異常檢測,得到每條內容的流量數據中的水分流量;
根據每一組所述博主列表中每條內容的水分流量,計算得到每一組所述博主列表中每個待分析博主的水分流量。
優選的,所述獲取多個待分析博主的賬號信息,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于有米科技股份有限公司,未經有米科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910567614.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于改進特征選擇的電力文本分類方法
- 下一篇:一種面向目標的情感分類方法





