[發明專利]一種面向微博的話題影響力評估方法有效
| 申請號: | 202110192675.0 | 申請日: | 2021-02-20 |
| 公開(公告)號: | CN113268976B | 公開(公告)日: | 2023-09-12 |
| 發明(設計)人: | 張致遠;常藝茹;張陽;陳乃月 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F16/35;G06F16/951 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 劉源 |
| 地址: | 100044 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 話題 影響力 評估 方法 | ||
1.一種面向微博的話題影響力評估方法,其特征在于,包括:
根據某個話題的全部的點贊數、轉發數和評論數,獲得用戶參與度以及該某個話題的全部的點贊數、轉發數和評論數的權重;具體包括:
構建判斷矩陣
R=(rij)m×n(i=1,2,…,m;j=1,2,…,n)?????(1),并對該判斷矩陣進行標準化處理,獲得
其中
rmin=min(r1j,r2j,…rmj),rmax=max(r1j,r2j,…rmj)???(3);式(1)中,m表示話題,n表示用戶參與度的衡量指標數,R是一個m行n列的矩陣,rij表示第i個話題的第j個指標的值;式(2)中,rmax、rmin分別表示同一衡量指標下不同話題的相關文章數中點贊數、轉發數和評論數的最大值或最小值,bij表示將rij進行最小-最大標準化后的值;
通過式
W=(wj)1×n?????(4)獲得所述每個話題的全部的點贊數、轉發數和評論數的權重;式中
式(7)中,fij表示第i個話題的第j個指標的比重,并且是對fij′修正后的值;
根據該話題的相關文章數占所有話題文章的比例,以及該話題在單位時間內的文章數,獲得該話題的活躍度;具體包括:
根據某個話題的相關文章數占所有話題文章的比例以及該話題在單位時間內的文章數獲得所述話題的活躍度;其中,Mj是話題j的相關文章數,M是所有話題的全部文章數,Tj是話題j的持續時間;
根據該話題被涉及的持續時間單元數,獲得該話題的總持續時間;具體包括:通過式
nu=ne-nb????(9)獲得話題的總持續時間nu,式中,nu是話題被報道和討論的時間單元數,以天為單位,ne表示話題消亡的時間,nb表示話題產生的時間;
通過當前某時刻與該話題首次發布時間的時間單元數差,獲得該話題的新穎性指標;具體包括:
通過式
△t(j)=tt-tp????(10)獲得該話題的新穎性指標△t(j),式中△t(j)是當前時間與話題首次發布時間的時間單元數差,以天為單位,tt是當前時間,tp是話題首次發布時間;
根據該話題的用戶參與度、活躍度、持續時間單元數和新穎性指標獲得該話題的熱度;具體包括:
通過式
獲得所述話題的熱度;式中:
Dj是話題j的全部點贊數,α是點贊數對用戶參與度的權值;
Zj是話題j的全部轉發數,β是轉發數對用戶參與度的權值;
Pj是話題j的全部評論數,γ是評論數對用戶參與度的權值;
Mj是話題的相關文章數,M是所有話題的全部文章數;
Tj是話題j的持續時間;
nu是話題被報道和討論的時間單元數,Tj=nu;
n是整個爬蟲時間段被切分的時間單元總數;
△t(j)是當前時間與話題首次發布時間的時間單元數差;
衰減系數k取值0.1;
在獲取時間單元數時,當時間差的小時數大于12時或天數為0時,該時間單元數都按加1天計算,即式(11)中的Tj取值加1,若天數不為0且小時數不足12時,則不足12時的部分不按1天計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110192675.0/1.html,轉載請聲明來源鉆瓜專利網。





