[發明專利]基于改進版PageRank以及綜合影響力的推薦方法有效
| 申請號: | 201810998944.0 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109271584B | 公開(公告)日: | 2022-02-15 |
| 發明(設計)人: | 黃彬彬;何馥蕓;沈艷婷;楊澤彬 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q50/00 |
| 代理公司: | 杭州浙科專利事務所(普通合伙) 33213 | 代理人: | 吳秉中 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進 pagerank 以及 綜合 影響力 推薦 方法 | ||
本發明公開了一種基于有向圖改進版PageRank以及綜合評定微博影響力的用戶推薦方法,包括如下步驟:(1)Python爬蟲爬取新浪微博數據集;(2)通過數據集在關注關系與交互關系的基礎上建立有向圖模型;(3)加入綜合指標評定矩陣,得到加權概率轉移矩陣;(4)馬爾科夫迭代收斂得到最終PR值并進行Top?N推薦。與傳統方法相比,本發明所述方法可以有效避免僅通過關注關系建模,或者評判指標太過單一造成的局限性以及不準確性,實現了在數據范圍里更精確且可信度更高的影響力用戶的確定。
技術領域
本發明屬于社交媒體用戶推薦技術領域,具體涉及到一種基于有向圖改進版PageRank以及綜合評定微博影響力的用戶推薦方法。
背景技術
微博已經成為時下最流行的大眾化信息傳播媒介,通過微博平臺用戶可以輕易地完成各類信息的獲取、生產、分享和傳播。微博的另一大魅力是可以在這個虛擬網絡中認識更多的朋友,以新浪微博為例,用戶可以通過“你可能感興趣的人”這個模塊中由系統推薦的用戶,找到志趣相投的人。但是其實現有微博并沒有很好地推薦給用戶真正有微博影響力的用戶,推薦的用戶大多都是推銷或微商,人們不太會真正下手點關注。另外,傳統的研究微博用戶影響力的算法通常采用PageRank算法,然而該算法最原先是用于通過網頁的鏈入鏈出來判斷網頁是否重要,應用到社交關系中基本上所有的研究都只局限于人與人之間的關注關系,其實并不全面,因為社交關系中除了關注,還存在交互關系。我們可以理解為,除了A關注B能表示出B對A有影響力,然而其實如果A轉發了很多C的微博,但并沒有關注C,我們這里就不能否認C對A同樣也有影響力。且PageRank中設定轉到每頁面的概率是平均的,其實不然。因此,傳統PageRank算法建模部分需要改進。
另外,除了用戶交互關系與關注關系,備選用戶自身的素質對影響力的評判也有決定性的作用。傳統PageRank缺少這部分,現有的前人的研究有提出加入影響力指標的想法,一些研究者直接選擇特定的大V用戶進行研究,顯然有點太過籠統;一些研究者設定了幾個衡量指標,但指標不夠細化,不夠科學,所以影響力指標需要更加綜合地評定。
發明內容
本發明針對現有技術的不足,提供了一種基于有向圖改進版PageRank以及綜合評定微博影響力的用戶推薦方法。
本發明方法的具體步驟是:
步驟(1)通過Python爬取新浪微博上2000個左右的用戶及用戶關系的微博作為實驗數據集,以Excel形式分成以下四個表:
①User_info(用戶信息表):用戶id、微博昵稱、居住地區、微博數、關注數、粉絲數、點贊數、轉發數、評論數以及是否是微博認證用戶(是否有大V標識);
②Follows(用戶關注表):用戶id和他/她所關注的用戶的id;
③Followers(用戶粉絲表):用戶id和他/她的粉絲的id;
④Rwtweets(用戶轉發表):用戶id、微博昵稱以及他/她每條轉發微博的出處(他/她轉發了誰)id以及昵稱。
步驟(2)步驟(1)所得的數據集需經過嚴格的預處理,處理成適合PageRank的數據格式,如用戶節點用1,2,3表示,便于后續有向圖的建模。
步驟(3)建模,A-B表示B關注A,邊上的數字表示有向邊的權值。A的微博被B轉發則也表示在A-B邊上,都被視為A的影響力去向。
步驟(4)設用戶i關注人數為Fi,設轉發微博條數為Ti,則通過皮爾遜相關系數來計算關注與轉發之間的相關性RFT:
設關注權值為WF,則轉發權值WT=WF×RFT
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810998944.0/2.html,轉載請聲明來源鉆瓜專利網。





