[發明專利]一種基于隱鏈接分析熱點話題傳播趨勢的系統及方法有效
| 申請號: | 201711380260.6 | 申請日: | 2017-12-20 |
| 公開(公告)號: | CN108564479B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 肖云鵬;梁霞;杜江;謝小秋;劉宴兵;李凈樺 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00;G06F16/9536 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 李金蓉 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 鏈接 分析 熱點話題 傳播 趨勢 系統 方法 | ||
1.一種基于隱鏈接分析熱點話題傳播趨勢的系統,其特征在于,包括:
數據獲取模塊、隱鏈接建立模塊、影響力定義模塊及動力學模型構建模塊,其中數據獲取模塊,主要用于直接從基于web研究型的推薦系統下載或利用成熟的社交平臺的應用程序編程接口獲取數據,并對數據進行包括相應屬性的預處理后發送給隱鏈接建立模塊后,利用K-近鄰算法建立隱鏈接;
隱鏈接建立模塊,主要用于提取相關屬性,建立隱鏈接,從已有數據中提取用戶之間標簽相似度、相同話題、共同好友、文本相似性四個屬性,利用K-近鄰算法,構建用戶之間的隱鏈接,進而計算非好友之間的影響力;
影響力定義模塊,用于根據個體驅動機制和好友驅動機制,分別用多個屬性構成個體影響力和好友影響力兩個因素定義熱點話題傳播的影響力,并利用多元線性回歸模型,分析影響力;
動力學模型構建模塊,用于把信息傳播運用到動力學模型中,把影響力因子引入到動力學模型中,分析熱點話題傳播趨勢;
所述動力學模型構建模塊中定義影響力流程具體可分為兩個步驟:
S41:根據傳染率λ不是一直不變的定值,是隨時間和個人興趣、愛好不斷變換的,利用平均場理論,對傳染率λ進行描述;
S42:分別利用隱鏈接的影響力和顯鏈接的影響力構建SIR傳染病模型,將影響力作為感染率引入到傳染病模型中,動力學方程如下式(16)所示:
其中λ1表示顯鏈接的感染率,λ2表示隱鏈接的感染率,利用時間分片的方法,把每2個小時參與話題的人作為一個時間段分片,其中I(t)表示一個時間段分片中消息已知者的人數,S(t)表示一個時間段分片中消息未知者的人數,μ表示從消息已知者轉換為消息免疫者的概率。
2.根據權利要求1所述的一種基于隱鏈接分析熱點話題傳播趨勢的系統,其特征在于,所述數據獲取模塊抓取某三個熱點話題下的轉發或評論用戶的信息,包括已參與話題討論用戶的粉絲信息。
3.根據權利要求1所述的一種基于隱鏈接分析熱點話題傳播趨勢的系統,其特征在于,所述隱鏈接建立模塊從已有數據中提取用戶之間標簽相似度、相同話題、共同好友、文本相似性四個屬性,根據數據方面的特征對其進行修改,具體如下:
1)標簽相似度tagsim(vi,vj):
A表示用戶vi的標簽,B表示用戶vj的標簽,用Jaccard系數進行歸一化計算,Jaccard系數越大,表示兩個用戶標簽相似度越大;
2)相同話題comtopic(vi,vj)和共同好友comfriend(vi,vj)通過獲取的數據直接統計出來;
3)文本內容相似性textsim(θ):
textsim(θ)=cosθ (2)
式(2)中的余弦值cosθ的定義如下式(3)所示:
將兩個用戶的發的微博的詞,建立兩個向量a,b,計算這兩個向量的余弦值,就得到這兩個用戶的文本在統計學方法中他們的相似情況,其中(x1,y1)代表向量a的坐標,(x2,y2)代表向量b的坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711380260.6/1.html,轉載請聲明來源鉆瓜專利網。





