[發明專利]一種微博中特定用戶的相似用戶監控方法在審
申請號: | 201510363990.X | 申請日: | 2015-06-26 |
公開(公告)號: | CN105045822A | 公開(公告)日: | 2015-11-11 |
發明(設計)人: | 仲兆滿;管燕 | 申請(專利權)人: | 淮海工學院 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 連云港潤知專利代理事務所 32255 | 代理人: | 劉喜蓮 |
地址: | 222000 江蘇省連云港市海*** | 國省代碼: | 江蘇;32 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 微博中 特定 用戶 相似 監控 方法 | ||
1.一種微博中特定用戶的相似用戶監控方法,其特征在于,其步驟如下:
A、根據輸入的特定用戶su得到擴展自我網絡EEN——ExtendedEgoNetwork的用戶集,記為EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su),其中FollowerCS(su)為su的關注集,FansCS(su)為su的粉絲集,VisitorCS(su)為su的訪客集;
其具體步驟如下:
A1、獲取時間片TimeSpan內用戶su的所有微博集MB-su,包括原創、轉發、評論的微博;
A2、獲取su的關注集FollowerCS(su)和粉絲集FansCS(su);
A3、根據su的微博集MB-su提取訪客集VisitorCS(su),將三類用戶記為EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su);
B、基于用戶的關注、粉絲和動態微博的相似度,以及用戶間的動態交互相互性,從EEN(su)中發現與su相似的用戶集SimUser(su)íEEN(su),其具體步驟如下:
B1、獲取每個用戶在時間片TimeSpan內的微博集MB-useri、關注集FollowerCS(useri)、粉絲集FansCS(useri);
B2、計算用戶su與的動態微博相似度,記為MBSim(su,useri),其中,Tj為某個時間片,Tj-T1的計算結果為時間片相差個數,l為指數衰減參數,用戶useri在Tj時間片的微博向量化表示為:其中,為特征項權重,使用TF*IDF方式計算,在時間片Tj兩個用戶su,useri的微博相似度使用余弦夾角方式計算:
B3、計算用戶su與的動態交互相關性,記為RC(su,useri),其中,Tj為某個時間片,Tj-T1的計算結果為時間片相差個數,l為指數衰減參數,在時間片Tj兩個用戶su,useri的交互相關性為他們的交互次數,記為m個時間片的最大交互次數記為RCmax,以RCmax為參考對用戶的交互相關性進行歸一化:
B4、計算用戶su與的關注相似度,記為FollowerSim(su,useri),
B5、計算用戶su與的粉絲相似度,記為FansSim(su,useri),
B6、最終得到用戶su與的相似度Sim(su,useri),
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淮海工學院,未經淮海工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510363990.X/1.html,轉載請聲明來源鉆瓜專利網。