[發明專利]網絡論壇中輿論領袖分析方法有效
| 申請號: | 201110232191.0 | 申請日: | 2011-08-15 |
| 公開(公告)號: | CN102314489A | 公開(公告)日: | 2012-01-11 |
| 發明(設計)人: | 張宏莉;張偉哲;張玥;李東;陳琳 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 論壇 輿論 領袖 分析 方法 | ||
1.一種網絡論壇中輿論領袖分析方法,其特征在于,
一、基于論壇語料的影響力計算
對于某話題,由a1,a2,a3,…,an組成的回復對話鏈關系中,設w1,w2,w3,…,wn分別為a1,a2,a3,…,an發帖人所發帖子的詞匯集合,i1,i2,i3,…,in分別為此對話鏈中a1,a2,a3,…,an發帖人對其它人的影響力指標,則對于簡單語料IDM模型計算方法改進為如下規則:
(1)首先計算任意兩個發帖人之間的影響力,采用兩兩比較的方法計算,產生了基于對話鏈的階梯式計算次數,稱為階梯式評價方法;Cx、Cy表示網民x、y的發帖內容,Wx、Wy表示帖子文本詞語集合,如果y回復x,則認為x影響y,影響力通過對話鏈由Cx傳遞給Cy,將Cx對Cy的影響用符號ix,y表示;影響力ix,y通過計算x的帖子內容Cx與y的帖子內容Cy得到;首先分別對Cx與Cy進行分詞,然后計算兩分詞集合的相似程度,找出詞語交集。Cx對Cy的影響力表示為Cx與Cy中詞語的交集占Cy詞語總數的比例;
假設Cy回復Cx,Cz回復Cy,那么,Cx對Cz的影響力用ix,z表示,即Cx、Cy與Cz中詞語的交集占Cz中詞語總數的比例與Cx對Cy的影響力ix,y的乘積;
C1為主帖,C2、C3分別回復C1,C4回復C2;C1包含A、B、C三個詞,C2包含A、C、D三個詞,C3包含B、F兩個詞,C4包含C、F兩個詞;C1、C2詞語交集為A、C,C1對C2影響力為2/3;C1與C3詞語交集為B,C1對C3影響力為1/2;C1、C3、C4詞交集為C,C1對C4影響力為1/2×2/3;
多級回復關系中任一帖子對回復關系鏈中任一回復的影響力計算公式為:設Ci為起始帖,ξi,z表示從Ci開始到Cz結束的對話關系鏈,則ξi,z={Ci,Cj,Ck,…Cq,Cr,…Cy,Cz,其中i<j<k…q<r…y<z}用ii,r來表示Ci對Cr影響力;
(2)其次計算對話鏈中任一個發帖人在整個對話鏈中的影響力;方法為計算對話鏈中此發帖人對其它發帖人的影響力的總和;其中,ii為發帖人i在對話鏈中的影響力,ii,i+1,ii,i+2,…,ii,n分別為i對其后的每一個回復的影響力指標;
Ii=ii,i+1+ii,i+2+…+ii,n???????????(1-4)
(3)對于發帖人i在該話題的多個對話鏈及總的影響力評價指標的計算,用Dci來表示Ci所引發的Pi個對話關系鏈中總的影響力,Pi個對話鏈中總的影響力;
論壇發帖者x基于語料的論壇總的影響力Dx.;
二、基于網絡統計屬性的影響力計算
(1)基于參與者統計屬性特征:帖子的支持率、發帖數、回帖數和網齡;刻畫網民在論壇中基本行為的統計數據;
設A={a1,a2,…,an}為論壇中某個話題的網民的集合,Xi為某個統計屬性,X={xij}為屬性矩陣,xij是第i個網民的第j個屬性,屬性值函數用fj表示,則xij=fj(ai),其中i=1,2,…,n;j=1,2,…,m;ai的屬性值xij作如下定義:
ai1:表示ai的活躍程度,通過發帖數量來計算;
ai2:表示ai的被認同度,通過支持帖數和反對帖數之差來計算;
ai3:表示ai的說服力,通過帖子的長短來計算;
ai4:表示ai的感染力,通過關注數與粉絲數之和來計算;
ai5:表示ai認知力,通過社區積分等來計算;
ai6:表示ai知名度,通過職位、職業、學歷、網年與專業等來計算;
(2)屬性值的歸一化處理,設變換后的屬性矩陣為Z={zij},其中i=1,2,…,n;j=1,2,…,m,xjmin和xjmax分別為屬性矩陣中第j列屬性的最小值和最大值;
(3)確定參與者屬性特征權重;采用矩陣專家法和Saaty的10級重要性等級量表,通過比較任意兩個屬性間的重要程度來確定權重;
以前面定義的六個屬性活躍程度、被認同度、說服力、感染力、認知力和知名度為例,經過經驗分析認為,活躍程度與被認同度介于同等重要和略微重要之間,b12=2;說服力與活躍程度相比略微重要,則可取b13=3;活躍程度與感染力相比明顯重要,b14=7;說服力與被認同程度相比同等重要,則可取b23=1,被認同程度與感染力相比比較重要,則可取b24=5;說服力與感染力相比比較重要,則可取b34=5,其余各項權值依次取值;
利用計算絕對值最大的特征值的乘冪法計算,由權值矩陣B可以計算出其權值特征向量Wij,通過取n維異于0的初始向量v0=(x0(0),x1(0)…xn-1(0))T對k=0,1,…;直到滿足|||uk||2-||uk-1||2|<ε為止,求得權值矩陣的權值向量Wij;
uk=Bvk-1??????????????????????(1-9)
wij=[w1,w2,…wm]????????????(1-11)
(4)利用加權平均算法計算基于參與者統計屬性特征的輿論領袖評價指標;根據決策理論的方法描述假設可知,通過加權平均算法來計算,得分越高者與參與者是輿論領袖的可能性比重加大相一致;A={a1,a2,…,an}為話題參與者的集合,設ai屬性的加權平均值為Ei,aj屬性的加權平均值為Ej,若Ei≥Ej,則:是輿論領袖的可能性:ai≥aj;反之,則:ai≤aj,加權平均的計算公式如1-12所示,wij為絕對值最大的特征向量,zij為歸一化后的屬性矩陣;
三、綜合計算輿論領袖值
根據Di和Ei的計算過程及上述分析可知,兩者之和越大,輿論領袖的作用越突出;λ是參數;設Qi為輿論領袖的綜合評價指標;
Qi=Di+λEi?i=1,2,…,n????????(1-13)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110232191.0/1.html,轉載請聲明來源鉆瓜專利網。





