[發明專利]微博特定話題內高影響力用戶挖掘方法在審
| 申請號: | 201811629337.3 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109800351A | 公開(公告)日: | 2019-05-24 |
| 發明(設計)人: | 張明新;劉威 | 申請(專利權)人: | 常熟理工學院 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/951;G06F16/33;G06Q50/00 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 吳茂杰 |
| 地址: | 215500 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 轉發 話題 關系網絡 用戶挖掘 信息傳播能力 微博 用戶影響力 降序排列 爬蟲程序 真實數據 質量計算 貢獻度 時效性 網絡 輸出 傳播 分析 | ||
1.一種微博特定話題內高影響力用戶挖掘方法,其特征在于,包括如下步驟:
(10)爬取微博話題:利用爬蟲程序,爬取特定微博話題的相關真實數據;
(20)網絡劃分:根據用戶與話題之間的互動關系,將網絡劃分為用戶轉發關系網絡和用戶博文轉發關系網絡,并基于已劃分網絡分析用戶間不同時間轉發對被轉發用戶影響力的貢獻度;
(30)用戶話題轉發影響力計算:基于用戶轉發關系網絡,根據用戶活躍度和用戶行為時間計算用戶話題轉發影響力;
(40)用戶自身質量計算:基于用戶博文轉發關系網絡,根據用戶博文質量和用戶行為時間計算用戶自身質量;
(50)用戶話題信息傳播能力計算:根據用戶話題轉發影響力和用戶自身質量,計算用戶話題信息傳播能力;
(60)高影響力用戶挖掘:將用戶話題信息傳播能力和用戶與微博話題關聯度進行線性融合,計算得到用戶話題傳播影響力,并降序排列輸出。
2.根據權利要求1所述的挖掘方法,其特征在于,所述(20)網絡劃分中,量化用戶不同時間轉發的貢獻度具體為,按如下公式計算用戶間不同時間轉發對被轉發用戶影響力的貢獻度:
其中,O1(u)表示用戶u發布話題博文集合,為用戶v轉發用戶u第i條博文的時間差,λ為控制衰減速率的參數,ri(v,u)代表用戶v是否轉發用戶u的第i條博文。
3.根據權利要求2所述的挖掘方法,其特征在于,所述(30)用戶話題轉發影響力力計算步驟包括:
(31)用戶活躍度計算:按下式計算用戶活躍度,
其中,npost(u)是用戶在時間段T內發布博文數量,nrepost(u)是用戶在時間段T內的轉發數量,T是時間段長度;
(32)用戶話題轉發影響力計算:按下式計算用戶話題轉發影響力,
其中,R(u)為用戶u的轉發影響力,O2(u)為用戶u的轉發用戶集合,R(v)為用戶v的轉發影響力,out(v)為用戶v指向其他用戶的轉發,c為阻尼系數。
4.根據權利要求3所述的挖掘方法,其特征在于,所述(40)用戶自身質量計算步驟具體為,按下式計算用戶自身質量:
其中,O4(b)是用戶u的所有博文集合,
wb(u)為用戶u的博文b對用戶u自身質量計算的貢獻度,
wb(u)=Nb/Nc,
Nb為用戶u的博文b的總轉發數,Nc為用戶u所有博文總轉發數。
5.根據權利要求4所述的挖掘方法,其特征在于,所述((50)用戶話題信息傳播能力計算步驟具體為,按下式計算用戶話題信息傳播能力:
Spread(u)=α1×R(u)+α2×Q(u)
其中,α1是用戶轉發影響力所占比重,α2是用戶自身質量所占比重,R(u)為用戶u在話題參與過程中的轉發影響力,Q(u)為用戶u在話題參與過程中表現出的自身質量。
6.根據權利要求5所述的挖掘方法,其特征在于,所述(60)高影響力用戶挖掘步驟包括:
(61)用戶與微博話題關聯度計算:按下式計算用戶與微博話題關聯度,
式中,話題文檔集合的主題概率分布Vtopic,向量Vtopic和Vu之間的KL距離DKL(Vu||Vtopic),
用戶文檔集合的主題概率分布Vu,
微博話題文檔集合的主題概率分布Vtopic,
式中,pui和ptopici分別是用戶u的文檔集合和微博話題文檔集合產生主題i的概率,且
(62)用戶話題傳播影響力計算:按下式計算用戶話題傳播影響力,
TSRank(u)=Spread(u)×S(u,topic);
(63)高影響力用戶挖掘:根據用戶話題傳播影響力降序排列,得到影響力排名靠前的高影響力用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于常熟理工學院,未經常熟理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811629337.3/1.html,轉載請聲明來源鉆瓜專利網。





