[發明專利]一種基于微博用戶自身和行為價值二階的影響力評估方法有效
| 申請號: | 201811393912.4 | 申請日: | 2018-11-21 |
| 公開(公告)號: | CN109492924B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 楊靜;馬博文;張健沛;王勇 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/00;G06F16/951 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 自身 行為 價值 影響力 評估 方法 | ||
1.一種基于微博用戶自身和行為價值二階的影響力評估方法,其特征在于,包括:
步驟1:利用爬蟲技術和微博官方API接口進行微博的數據采集,按照話題分類采集用戶和用戶關注者、粉絲的全部信息;
步驟2:對采集后的數據處理,包括用戶靜態屬性的清理、用戶動態行為信息的篩選,不僅要清洗出采集到數據中用戶粉絲ID、數量、推送微博ID、數量、轉發者ID,還要將用戶的粉絲、轉發者做為用戶進行二次迭代分析,得出用戶的特征向量;
所述用戶的特征向量包括用戶信息、用戶關系、微博信息;所述用戶信息包括用戶ID、用戶粉絲數、關注數、發布微博數;所述用戶關系包括用戶ID、關注用戶的ID、粉絲ID;所述微博信息包括用戶ID,被轉發數、被轉發者ID;
步驟3:通過用戶所有粉絲的自身價值來計算該用戶的自身價值,通過步驟二中得到的用戶粉絲數量和粉絲的粉絲數量計算出用戶自身價值,用戶自身價值計算公式如下所示:
其中,ki表示用戶i的粉絲數;kj1表示用戶i的第1個粉絲的粉絲量;
步驟4:通過用戶所有推送轉發者的行為價值來計算用戶的行為價值,通過步驟二中得到的用戶推送微博的轉發數量和轉發者的推送微博轉發數量計算出用戶行為價值,用戶行為價值影響力計算公式:
其中,Hbi表示用戶i的一階行為價值;表示用戶i推送的第ni篇微博的轉發量;ni表示用戶i推送微博的數量;Hbi(2)表示用戶i的二階行為價值,即用戶行為價值影響力;
步驟5:綜合用戶的自身與行為價值計算用戶最終的影響力,綜合影響力計算公式如下所示:
其中,H-mining(i)表示用戶i的綜合影響力,取值為用戶的自身價值影響力和用戶行為價值影響力做歸一化處理的加權和;α=0.8。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811393912.4/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





