[發明專利]一種基于社交網絡用戶行為的用戶影響力分析方法有效
| 申請號: | 201410146306.8 | 申請日: | 2014-04-11 |
| 公開(公告)號: | CN103886105B | 公開(公告)日: | 2017-05-17 |
| 發明(設計)人: | 姜偉;高夢迪;張建標;賴英旭;李健;莊俊璽;張世翔 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京思海天達知識產權代理有限公司11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 網絡 用戶 行為 影響力 分析 方法 | ||
技術領域
本發明涉及信息技術領域,特別是涉及一種基于社交網絡用戶行為的用戶影響力分析方法。
背景技術
隨著互聯網的發展,用戶已經從一個被動的通過瀏覽器從各大網站獲取信息閱讀信息的瀏覽者,轉向了可以主動參與到互聯網的發展之中的編輯者,使用者和傳播者。在web2.0時代,用戶擁有更多的話語權和主動權,可以直接參與和發布內容,極大加強了用戶間的交流性。社交網絡作為這個時代一個突出的產物,其具有用戶規模大,話題種類多,信息傳遞迅速和影響范圍廣等特點。社交網絡的迅速發展已經成為了一個新型了信息載體和轉播媒介,對于日常工作和生活產生的影響也越來越大。在信息傳播的過程中,意見領袖作為一種重要力量,在社會輿論的形成過程中發揮著不可忽視的作用,局部意見在意見領袖的引導下演化為輿論,影響力直接滲透到現實社會。
為了識別出社交網路中的意見領袖,需要分析社交網路中用戶的影響力,找出影響力強的用戶?,F有的基于社交網絡分析影響力的方法分為三大類。第一類是基于PageRank網頁排名算法?;赑ageRank的算法,多為對社交網絡中的某一個因素,套用PageRank的思想,計算出用戶影響力。其不足是所用的因素比較單一,沒有針對內容分析。第二類基于影響力擴散模型(IDM),IDM模型主要是針對話題,根據帖子上下文詞語出現的頻率關系,得到話題的影響力。通過計算用戶所有話題得到用戶的影響力。這種方法的不足是用戶之間的聯系不太緊密。第三類是傳統的基于用戶行為模型。該模型通過統計用戶的各種行為,例如跟隨、轉推、提及,來計算用戶的影響力。這種方法比較簡單,但是各種行為的歸一化系數不好確定。
發明內容
本發明提供了一種基于社交網絡用戶行為的用戶影響力分析方法。這個方法可以通過社交網絡的數據集,從用戶關系和用戶活動兩種方法,綜合分析出影響力強的用戶,包括如下步驟:
步驟1:統計分析相關數據信息
在社交網絡中,數據量非常龐大,為了從龐大的數據量中分析用戶影響力首先需要統計以下信息。第一,統計分析社交網絡中用戶之間的關注和被關注關系。第二,統計分析用戶之間的評論數目和評論內容。
步驟2:用戶關系影響力計算
用戶關系影響力是實現過程借鑒了PageRank網頁排名算法的思想,以用戶之間的關注情況類比PageRank中的鏈接情況。通過公式(1)計算出用戶關系影響力。由于用戶關系影響力算法是一收斂算法,所以其結果只與用戶之間相互關注的關系有關,與用戶初始值無關。
公式中R(i)表示i用戶的用戶關系影響力,R(j)表示j用戶的影響力,L(j)表示j用戶的關注數目,B(i)表示關注i用戶的用戶集。
步驟3:用戶活動影響力計算
針對于社交網絡,如果用戶A對用戶B發表了某些評論,那么說明用戶B的言論影響到了用戶A,從而用戶A可以將B言論中影響到他的部分繼續影響其他用戶,所以用戶B應該獲得用戶A的一部分影響力。具體用戶B獲得用戶A多少的影響力取決于三點。第一點,用戶A受到過多少用戶言論的影響。第二點,用戶A在受到所有言論的影響中B占有多大的比重。第三點,用戶A受到用戶B言論影響的程度。針對以上三點,用戶活動影響力可以通過公式(2)表示
在公式(2)中Ak+1(i)表示經過k+1次衰減傳遞后i用戶得到的影響力。B(i)表示關注i用戶的用戶集。表示j用戶評論i用戶的數目在j用評論所有用戶數目的比重。表示j用戶對i用戶的評論中,j用戶和i用戶同時出現的關鍵詞數比i用于發表內容的關鍵詞數。d表示一個影響力衰減因子,為了使該公式與初值有關,要保證影響力的傳遞是遞減的,可以保證一定的遞減性,但是也有可能存在為1的情況,所以加入了衰減因子d,其可以設為小于1的固定值。由于該公式的逐步遞減并且趨于0,所以當Ak+1(i)的值小于首次計算活動影響力初值的百分之一時,其值可以忽略不計,所以k值有限。
步驟4:用戶影響力計算
公式(2)中計算出的第k次用戶活動影響力,是由于k-1次用戶活動影響力再傳遞一次產生的結果。所以通過累加第3步中所有用戶活動影響力的結果,計算得到用戶的影響力。該過程可以通過公式(3)表示。
在公式(3)中A(i)表示i用戶最終的影響力。Ak(i)表示i用戶經過第k次衰減傳遞后的影響力。
本發明與現有技術相比,具有以下明顯的優勢和有益效果:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410146306.8/2.html,轉載請聲明來源鉆瓜專利網。





