[發(fā)明專利]基于改進(jìn)版PageRank以及綜合影響力的推薦方法有效
| 申請?zhí)枺?/td> | 201810998944.0 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109271584B | 公開(公告)日: | 2022-02-15 |
| 發(fā)明(設(shè)計(jì))人: | 黃彬彬;何馥蕓;沈艷婷;楊澤彬 | 申請(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q50/00 |
| 代理公司: | 杭州浙科專利事務(wù)所(普通合伙) 33213 | 代理人: | 吳秉中 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 改進(jìn) pagerank 以及 綜合 影響力 推薦 方法 | ||
1.一種基于有向圖改進(jìn)版PageRank以及綜合評定微博影響力的用戶推薦方法,包括如下步驟:(1)Python爬蟲爬取新浪微博數(shù)據(jù)集;(2)通過數(shù)據(jù)集在關(guān)注關(guān)系與交互關(guān)系的基礎(chǔ)上建立有向圖模型;(3)加入綜合指標(biāo)評定矩陣,得到加權(quán)概率轉(zhuǎn)移矩陣;(4)馬爾科夫迭代收斂得到最終PR值并進(jìn)行Top-N推薦;
所述步驟(1)具體如下:
Python爬蟲爬取新浪微博上2000個用戶及其衍生的幾十萬粉絲以及關(guān)注用戶數(shù)據(jù)集,爬取四張數(shù)據(jù)表:①User_info表、②Follows表、③Followers、④Retweets;
所述步驟(2)具體如下:
設(shè)用戶i關(guān)注人數(shù)為Fi,設(shè)轉(zhuǎn)發(fā)微博條數(shù)為Ti,則通過皮爾遜相關(guān)系數(shù)來計(jì)算關(guān)注與轉(zhuǎn)發(fā)之間的相關(guān)性RFT:
設(shè)關(guān)注權(quán)值為WF,則轉(zhuǎn)發(fā)權(quán)值WT=WF×RFT;
研究用戶i影響力時,設(shè)用戶m全部轉(zhuǎn)發(fā)的微博數(shù)為Tm,轉(zhuǎn)發(fā)用戶i的微博數(shù)為Tmi,則依次根據(jù)皮爾遜算出所有其他用戶與用戶i的微博轉(zhuǎn)發(fā)相關(guān)性Rmit;
則用戶m轉(zhuǎn)發(fā)用戶i的微博時的權(quán)值為Wmit=Rmit×WT,即用戶i對用戶m的影響力即兩者之和Influenceim=Wmit+WF,而用戶i的總影響力就為與其有關(guān)的用戶m1、用戶m2…用戶mn之和,即
其他用戶依次類推;
將Influenceim類比到不同的兩個用戶之間,列出轉(zhuǎn)移矩陣,每行表示一個用戶,一行里的每個數(shù)值表示這個人對所有人的影響權(quán)值;每列也表示一個用戶,一列里每個數(shù)值表示這個用戶被別人影響的權(quán)值,得到初步的轉(zhuǎn)移矩陣mij。
2.如權(quán)利要求1所述的基于有向圖改進(jìn)版PageRank以及綜合評定微博影響力的用戶推薦方法,其特征在于:步驟(3)具體如下:
加入綜合指標(biāo)評定矩陣,得到加權(quán)概率轉(zhuǎn)移矩陣;
用戶i的綜合評定影響力指標(biāo)如下:
W(i)=Quality(i)×α+Outdegree(i)×β+Confidence(i)×γ+Active(i)×δ,
α+β+γ+δ=1,α、β、γ、δ為權(quán)值;
Quality(i)表示用戶博文質(zhì)量,公式如下:
Quality(i)=Retweets(i)×α′+Comments(i)×β′+Likes(i)×γ′
α′+β′+γ′=1,α′、β′、γ′為權(quán)值;
Retweets(i)表示轉(zhuǎn)發(fā)數(shù),Comments(i)表示評論數(shù),Likes(i)表示點(diǎn)贊數(shù);
Outdegree(i)表示出度,即粉絲數(shù);
Confidence(i)表示置信度;
Active(i)表示活躍度,即
ni表示用戶i發(fā)表的博文數(shù),N表示全部博文數(shù);
Mij=Wi*mij
其中mij是初始加權(quán)概率轉(zhuǎn)移矩陣,得到最終的加權(quán)概率轉(zhuǎn)移矩陣Mij。
3.如權(quán)利要求2所述的基于有向圖改進(jìn)版PageRank以及綜合評定微博影響力的用戶推薦方法,其特征在于:步驟(4)具體如下:
取一個合適的rank向量v,是一個n*1的矩陣,n即為節(jié)點(diǎn)數(shù),每一行數(shù)值為即
v′=v×mij;
通過PR公式進(jìn)行馬爾科夫迭代,
其中,d為阻尼系數(shù),用戶uj推薦給用戶u的pagerank值;
得到最終用戶的PR值,并取Top-10用戶作為本發(fā)明挖掘到的最具影響力用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810998944.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 接收裝置以及接收方法、以及程序
- 凈水濾芯以及凈水裝置、以及洗漱臺
- 隱匿檢索系統(tǒng)以及公開參數(shù)生成裝置以及加密裝置以及用戶秘密密鑰生成裝置以及查詢發(fā)布裝置以及檢索裝置以及計(jì)算機(jī)程序以及隱匿檢索方法以及公開參數(shù)生成方法以及加密方法以及用戶秘密密鑰生成方法以及查詢發(fā)布方法以及檢索方法
- 編碼方法以及裝置、解碼方法以及裝置
- 編碼方法以及裝置、解碼方法以及裝置
- 圖片顯示方法以及裝置以及移動終端
- ENB以及UEUL發(fā)送以及接收的方法
- X射線探測方法以及裝置以及系統(tǒng)
- 圖書信息錄入方法以及系統(tǒng)以及書架
- 護(hù)耳器以及口罩以及眼鏡





