[發明專利]社交媒體流量的水分流量處理方法、系統及設備有效
| 申請號: | 201910567614.0 | 申請日: | 2019-06-27 |
| 公開(公告)號: | CN110287322B | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 孔曉晴;李百川;蔡銳濤 | 申請(專利權)人: | 有米科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/958;G06F17/18;G06Q50/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 古利蘭 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社交 媒體 流量 水分 處理 方法 系統 設備 | ||
1.一種社交媒體流量的水分流量處理方法,其特征在于,所述方法包括:
獲取多個待分析博主的賬號信息;
獲取每個所述待分析博主在預設周期內發布的每條內容對應的流量數據,其中,所述流量數據至少包括:每條內容的點擊數和獲取所述點擊數時所述待分析博主的粉絲數,所述點擊數包括轉發數或播放量;
基于每個所述待分析博主的賬號信息,對所述多個待分析博主進行分類,得到多組博主列表,其中,一組博主列表對應一類別博主;
針對每一組所述博主列表,以自然常數為底數,分別對每條內容對應的點擊數與粉絲數取對數;
計算取對數后的點擊數與粉絲數的比值,將所述比值作為粉絲互動比;
對所有內容對應的粉絲互動比進行正態性檢驗,確定所述博主列表中的所有內容是否符合正態分布;
若所述博主列表中的所有內容符合正態分布,針對所述博主列表中的每條內容,利用最大似然估計函數計算所述內容的流量數據的均值和方差對應的最大似然估計;
利用累積分布函數,分別計算所述內容和均值對應的概率分布值,得到第一概率分布值和第二概率分布值,其中,所述第一概率分布值為每條所述內容對應的概率分布值,所述第二概率分布值為每組所述均值對應的概率分布值;
計算所述第一概率分布值與第二概率分布值的差值,將所述差值作為每條內容的流量數據中的水分流量;
若所述博主列表中的所有內容不符合正態分布,將所述博主列表中的所有內容作為基于密度的異常檢測方式的檢測對象,根據局部可達密度lrd公式和局部離群因子LOF公式,計算得到每條內容的流量數據中的水分流量;
根據每一組所述博主列表中每條內容的水分流量,計算得到每一組所述博主列表中每個待分析博主的水分流量。
2.根據權利要求1所述的方法,其特征在于,所述獲取多個待分析博主的賬號信息,包括:
在預設周期內從社交媒體中獲取多個熱門博主、活躍博主和普通博主的賬號名id和簡介,其中,熱門博主為熱門榜單或熱門推薦中的博主,活躍博主為在所述熱門博主發布的內容下評論的博主,普通博主為從社交媒體中按照發布時間排序的非熱門榜單中獲取的博主。
3.根據權利要求1所述的方法,其特征在于,還包括:
將每條內容的水分流量的取值格式轉換為預設格式。
4.根據權利要求1所述的方法,其特征在于,所述根據每一組所述博主列表中每條內容的水分流量,計算得到每一組所述博主列表中每個待分析博主的水分流量,包括:
根據每一組所述博主列表中每條內容的水分流量,獲取每個所述待分析博主的每條內容對應的水分流量;
計算每個所述待分析博主的每條內容對應的水分流量的平均值,得到每個所述待分析博主的水分流量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于有米科技股份有限公司,未經有米科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910567614.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于改進特征選擇的電力文本分類方法
- 下一篇:一種面向目標的情感分類方法





