[發明專利]面向社交網絡的信息流行度預測方法及系統有效
| 申請號: | 201810069728.8 | 申請日: | 2018-01-24 |
| 公開(公告)號: | CN108304867B | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 肖云鵬;柳靚云;杜江;劉宴兵;張克毅;李茜曦;李曉娟;孫華超 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/00 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 劉小紅 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 社交 網絡 信息 流行 預測 方法 系統 | ||
1.一種面向社交網絡的信息流行度預測系統,包括:獲取數據源模塊、屬性提取模塊,所述獲取數據源模塊利用社交網絡中的用戶關系和節點行為數據,構建信息傳播網絡;屬性提取模塊,基于節點行為數據從個體行為維度提取并定義用戶相對活躍度,基于信息傳播網絡從節點交互維度出發,提取節點間交互次數并定義用戶間關注度、受重視度;其特征在于,還包括信息流行度預測模型構建模塊及流行度訓練預測模塊,所述信息流行度預測模型構建模塊,將上述提取屬性用于構建雙重加權社交網絡,并利用改進的PageRank算法度量雙重加權社交網絡中的節點傳播力,改進的PageRank算法改進體現在:一是將原算法中的阻尼系數更改成1減去節點權重,表示節點不傳播消息的概率,二是在原算法中融入節點的所有入邊節點間的影響力,以刻畫其他用戶對該節點的信任和依賴程度,同時針對信息傳播主要受信息源驅動和早期信息感染群體驅動的影響,提取信息發布者的個體特征和信息發布n小時內的轉發特征,利用邏輯回歸分類器訓練得到信息流行度預測模型;流行度訓練預測模塊,用于將訓練好的信息流行度預測模型對任意一條信息的流行度進行預測,發現網絡中重要的傳播節點;
所述屬性提取模塊從個體行為維度出發,提取用戶相對活躍度,刻畫用戶作為網絡中的個體在網絡群體中的相對權重,定義相對活躍度為其中,Mi為用戶提交消息總數,Ti為用戶注冊時間長度,表示網絡中用戶發布信息數的對數平均值,N為網絡用戶總數;
所述信息流行度預測模型構建模塊利用改進的PageRank算法度量雙重加權社交網絡中的節點傳播力具體包括,首先將用戶關系強度wij表示為邊權重,將用戶相對活躍度ai表示為節點權重,重新構建一個雙重加權社交網絡;然后對PageRank算法進行改進,根據公式:計算得到節點i的傳播力TC(i),其中,TC(i)表示節點i的傳播力,ai為節點相對活躍度,可以用來表示節點的傳播可能性,N為網絡節點個數,Ii為所有用戶i收到交互行為的用戶集合;
所述流行度訓練預測模塊對任意一條信息的流行度預測具體包括,對任一條信息m,以信息為中心從現有網絡中找出信息發布者vpos∈V和早期信息感染群體提取信息發布者特征和信息發布一小時內的轉發特征作為預測模型輸入通過訓練好的LR分類器預測信息的流行度ym,并根據節點傳播力的排序識別重要傳播節點。
2.根據權利要求1所述的面向社交網絡的信息流行度預測系統,其特征在于,所述屬性提取模塊從節點交互維度出發,利用節點間交互次數定義用戶間關注度為受重視度為綜合這兩個指標量化用戶關系強度為其中,nab表示用戶a→b的交互次數,同理,nba表示用戶b→a的交互次數;Oa為所有用戶a發出交互行為的用戶集合,反之,Ia為所有用戶a收到交互行為的用戶集合;為網絡中所有交互的對數均值。
3.根據權利要求1所述的面向社交網絡的信息流行度預測系統,其特征在于,所述提取信息發布者的個體特征和信息發布n小時內的轉發特征,利用LR分類器訓練得到信息流行度預測模型具體包括;針對信息源傳播驅動,提取信息發布者的個體特征,包括發文用戶的節點傳播力TC(m)、發文用戶的認證狀態STA(m);針對信息感染群體驅動,提取早期信息轉發特征,包括信息一小時內被轉發數一小時內轉發用戶的傳播力之和一小時內轉發用戶的認證數之和其中Vret表示信息發布一小時內的轉發用戶集合,上述特征組合成模型輸入將訓練樣本集中信息最終流行度ym∈{1,2,3,4}作為模型輸出,訓練LR分類器參數,構建信息流行度預測模型。
4.根據權利要求1所述的面向社交網絡的信息流行度預測系統,其特征在于,所述n為1。
5.一種基于權利要求1所述系統的面向社交網絡的信息流行度預測方法,其特征在于,包括以下步驟:
利用社交網絡中的用戶關系和節點行為數據,構建信息傳播網絡;基于節點行為數據從個體行為維度提取并定義用戶相對活躍度,基于信息傳播網絡從節點交互維度出發,提取節點間交互次數并定義用戶間關注度、受重視度,還包括信息流行度預測模型構建步驟及流行度訓練預測步驟,所述信息流行度預測模型構建步驟,包括:構建雙重加權社交網絡,并利用改進的PageRank算法度量雙重加權社交網絡中的節點傳播力,改進的PageRank算法改進體現在:一是將原算法中的阻尼系數更改成1減去節點權重,表示節點不傳播消息的概率,二是在原算法中融入節點的所有入邊節點間的影響力,以刻畫其他用戶對該節點的信任和依賴程度,同時針對信息傳播主要受信息源驅動和早期信息感染群體驅動的影響,提取信息發布者的個體特征和信息發布n小時內的轉發特征,利用邏輯回歸分類器訓練得到信息流行度預測模型;流行度訓練預測步驟,包括:將訓練好的信息流行度預測模型對任意一條信息的流行度進行預測,發現網絡中重要的傳播節點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810069728.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多視圖特征判別方法
- 下一篇:模型訓練方法、數據類型識別方法和計算機設備
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





