[發明專利]一種基于信息理論的微博傳播可視化分析方法與系統有效
| 申請號: | 201310151186.6 | 申請日: | 2013-04-26 |
| 公開(公告)號: | CN103279887A | 公開(公告)日: | 2013-09-04 |
| 發明(設計)人: | 王長波;葉鵬;劉玉華;肖昭 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00 |
| 代理公司: | 上海藍迪專利事務所 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 信息 理論 傳播 可視化 分析 方法 系統 | ||
1.一種基于信息理論的微博傳播可視化分析方法,其特征在于該方法具體包括:
a)基于微博數據的信息傳播影響因子分析
ⅰ)微博信息量計算
基于信息理論即香農熵理論計算微博信息量,具體地,對于在ti+1時刻出現的某一微博其信息量由數據集確定,即ti+1時刻之前的數據來確定,包括以下幾個步驟:
1)對數據集中的每條微博進行關鍵詞切分,然后統計出所有這些關鍵詞在數據集中的詞頻,建立關鍵詞詞頻字典;
2)對于目標微博
這里wi是微博關鍵詞keywordi的權重值,fi是關鍵詞keywordi在基數據集中出現的頻次,total是基數據集中所有關鍵詞的頻次;
3)計算目標微博的信息量MIQ,由下面公式得出:
采用來確定目標微博的信息量,這里(k-i)/i=0.04;
ⅱ)用戶偏好計算
通過分析用戶對微博的情感偏好和用戶關系偏好在微博傳播中的作用,函數化模擬用戶偏好在微博傳播中的影響,情感偏好的計算具體包括:
1)對于目標微博
2)求得該微博的情感值MEV定義為:
3)則該微博的情感ME可以被表示出來,如公式5所示:
4)最后定義用戶的情感偏好ET如下:
這里CountME是目標微博ME在基數據集中的數量,N是基數據集中基數據集中的微博總數,α是隨機參數;
用戶關系偏好的計算具體包括:
1)首先定義用戶影響因子如公式(7),
其中,Nfollowers是該用戶粉絲的數量,Ntotal是研究的數據集合中所有的用戶數;
2)用戶關系偏好函數IF定義如下:
IF=eUI+β???(8)
其中β是隨機參數;
b)微博傳播量化模型
結合微博信息量與用戶偏好以及信息衰減因子建立微博傳播量化模型,定量地跟蹤微博的傳播過程,具體地,根據上面的分析,給出微博傳播量化模型:
IDF(t)=τ(t)·MIQ·UF???(9)
UF=ET·IF???(10)
其中,IDF(t)是傳播到t時刻該微博的影響值,τ(t)=e-at是信息衰減因子,UF是用戶偏好。
2.一種基于信息理論的微博傳播可視化系統,其特征在于該系統具體包括:
a)層次布局可視化,動態展示微博傳播過程
結合同心圓環以及樹狀放射形的可視化技術,將微博基于時間序列的傳播形式轉化成同心圓環的層次形式,點分布在圓環中,每個點代表一個用戶,點顏色的深淺代表IDF值的大小;點與點的連線代表轉發與被轉發關系,具有向外放射的方向;線條基于微博傳播的時間特性動態的向外連接,展示微博傳播的過程;
b)基于信息量定量分析的微博炒作行為的發現
對于某一話題中的微博,計算它們的IDF值,并跟蹤微博的傳播情況,如果它們的IDF值較小,而微博傳播中卻有大量用戶參與,就標記為疑似炒作微博;
c)微博傳播過程中的異常用戶行為的發現
對微博傳播中的用戶進行跟蹤,如果傳播到該用戶時的IDF值較小,而該用戶的轉發數卻較多,則該用戶被標記為異常用戶;如果該微博的標記為疑似炒作微博且在傳播中包含的異常用戶數量大于一閾值,則該微博被標記為炒作微博。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310151186.6/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





