[發(fā)明專利]社交媒體流量的水分流量處理方法、系統(tǒng)及設備有效
| 申請?zhí)枺?/td> | 201910567614.0 | 申請日: | 2019-06-27 |
| 公開(公告)號: | CN110287322B | 公開(公告)日: | 2021-04-16 |
| 發(fā)明(設計)人: | 孔曉晴;李百川;蔡銳濤 | 申請(專利權)人: | 有米科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/958;G06F17/18;G06Q50/00 |
| 代理公司: | 北京集佳知識產(chǎn)權代理有限公司 11227 | 代理人: | 古利蘭 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社交 媒體 流量 水分 處理 方法 系統(tǒng) 設備 | ||
1.一種社交媒體流量的水分流量處理方法,其特征在于,所述方法包括:
獲取多個待分析博主的賬號信息;
獲取每個所述待分析博主在預設周期內(nèi)發(fā)布的每條內(nèi)容對應的流量數(shù)據(jù),其中,所述流量數(shù)據(jù)至少包括:每條內(nèi)容的點擊數(shù)和獲取所述點擊數(shù)時所述待分析博主的粉絲數(shù),所述點擊數(shù)包括轉(zhuǎn)發(fā)數(shù)或播放量;
基于每個所述待分析博主的賬號信息,對所述多個待分析博主進行分類,得到多組博主列表,其中,一組博主列表對應一類別博主;
針對每一組所述博主列表,以自然常數(shù)為底數(shù),分別對每條內(nèi)容對應的點擊數(shù)與粉絲數(shù)取對數(shù);
計算取對數(shù)后的點擊數(shù)與粉絲數(shù)的比值,將所述比值作為粉絲互動比;
對所有內(nèi)容對應的粉絲互動比進行正態(tài)性檢驗,確定所述博主列表中的所有內(nèi)容是否符合正態(tài)分布;
若所述博主列表中的所有內(nèi)容符合正態(tài)分布,針對所述博主列表中的每條內(nèi)容,利用最大似然估計函數(shù)計算所述內(nèi)容的流量數(shù)據(jù)的均值和方差對應的最大似然估計;
利用累積分布函數(shù),分別計算所述內(nèi)容和均值對應的概率分布值,得到第一概率分布值和第二概率分布值,其中,所述第一概率分布值為每條所述內(nèi)容對應的概率分布值,所述第二概率分布值為每組所述均值對應的概率分布值;
計算所述第一概率分布值與第二概率分布值的差值,將所述差值作為每條內(nèi)容的流量數(shù)據(jù)中的水分流量;
若所述博主列表中的所有內(nèi)容不符合正態(tài)分布,將所述博主列表中的所有內(nèi)容作為基于密度的異常檢測方式的檢測對象,根據(jù)局部可達密度lrd公式和局部離群因子LOF公式,計算得到每條內(nèi)容的流量數(shù)據(jù)中的水分流量;
根據(jù)每一組所述博主列表中每條內(nèi)容的水分流量,計算得到每一組所述博主列表中每個待分析博主的水分流量。
2.根據(jù)權利要求1所述的方法,其特征在于,所述獲取多個待分析博主的賬號信息,包括:
在預設周期內(nèi)從社交媒體中獲取多個熱門博主、活躍博主和普通博主的賬號名id和簡介,其中,熱門博主為熱門榜單或熱門推薦中的博主,活躍博主為在所述熱門博主發(fā)布的內(nèi)容下評論的博主,普通博主為從社交媒體中按照發(fā)布時間排序的非熱門榜單中獲取的博主。
3.根據(jù)權利要求1所述的方法,其特征在于,還包括:
將每條內(nèi)容的水分流量的取值格式轉(zhuǎn)換為預設格式。
4.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)每一組所述博主列表中每條內(nèi)容的水分流量,計算得到每一組所述博主列表中每個待分析博主的水分流量,包括:
根據(jù)每一組所述博主列表中每條內(nèi)容的水分流量,獲取每個所述待分析博主的每條內(nèi)容對應的水分流量;
計算每個所述待分析博主的每條內(nèi)容對應的水分流量的平均值,得到每個所述待分析博主的水分流量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于有米科技股份有限公司,未經(jīng)有米科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910567614.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種基于改進特征選擇的電力文本分類方法
- 下一篇:一種面向目標的情感分類方法





