[發明專利]一種微博中特定用戶的相似用戶監控方法在審
申請號: | 201510363990.X | 申請日: | 2015-06-26 |
公開(公告)號: | CN105045822A | 公開(公告)日: | 2015-11-11 |
發明(設計)人: | 仲兆滿;管燕 | 申請(專利權)人: | 淮海工學院 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 連云港潤知專利代理事務所 32255 | 代理人: | 劉喜蓮 |
地址: | 222000 江蘇省連云港市海*** | 國省代碼: | 江蘇;32 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 微博中 特定 用戶 相似 監控 方法 | ||
技術領域
本發明涉及一種信息挖掘技術,具體地說,涉及一種微博中特定用戶的相似用戶監控方法。
背景技術
當今,社交媒體被認為是Web上最有價值的信息資源之一。微博作為眾多社交媒體中的一種,由于其傳播性強、操作便利,很多用戶在微博形成了類似于現實社會的交往圈子。傳統媒體用戶和話題之間是二部網絡,微博由于引入了關注和粉絲,使得用戶和話題之間是多模網絡。由于微博信息傳播性強、具有復雜的網絡結構,近幾年引起了學術界和產業界的高度重視。
微博中的相似用戶是指在微博媒體上具有若干共同屬性的用戶群,這些屬性主要包括用戶的背景、關注、粉絲、微博、交互等信息。社交媒體上用戶的信息總體上分為兩類:一類是用戶的背景(比如地點、教育、職業、興趣等)和發表的微博信息;另一類是基于關注和粉絲構建的社交網絡。基于這兩類信息,已有的用戶相似度計算方法大體上可以分為三類:(1)基于用戶的背景和微博信息的方法,簡記為SUDByText;(2)基于關注和粉絲的社交網絡的方法,簡記為SUDBySN;(3)混合方法,即對方法SUDByText和SUDBySN的融合計算,簡記為SUDByTSN。當前,SUDByTSN是主流的研究方法。
在2011年美國出版的會議論文集:2011年可視化信息通信-交互會議(Proceedingsof2011VisualInformationCommunication-InternationalSymposium),題目為:社交網絡中基于興趣的朋友發現和推薦(Sfviz:interest-basedfriendsexplorationandrecommendationinsocialnetworks),作者是:GouL,YouF,GuoJ,WuL,ZhangXL,該文提出了使用用戶的社交標簽及網絡的拓撲結構計算用戶的相似度,網絡拓撲包括用戶的關注和粉絲,沒有利用訪客類用戶。
在2013年德國出版的期刊:UserModelingandUser-AdaptedInteraction,題目為:Exploringsocialtaggingforpersonalizedcommunityrecommendations,作者是:KimHN,SaddikAE,該文從一個用戶出發,基于社交標簽尋找到他感興趣的社區。社區的社交標簽通過社區成員的標簽提取,包括成員的興趣、情感、地理位置、時間等。
在2014年中國出版的期刊:中文信息學報,題目為:基于排序學習的微博用戶推薦,作者是:彭澤環,孫樂,韓先培,石貝,該文在進行微博用戶推薦時,利用了用戶的微博、個人信息、交互信息、社交拓撲信息等四類因素,認為用戶的交互信息對相似用戶的推薦性能影響最大。
在2014年中國出版的期刊:計算機學報,題目為:微博用戶的相似性度量及其應用,作者是:徐志明,李棟,劉挺,李生,王剛,袁樹侖,該文在度量用戶的相似度時,考慮了用戶的背景信息、微博、社交和交互信息。以50個用戶作為種子節點,爬取了1層關聯的粉絲、關注類用戶,并認為社交信息在計算用戶的相似度時最有價值。
發明內容
本發明所要解決的技術問題是針對以上所述現有技術存在的問題和不足,提供一種微博媒體監控相似用戶方法,該方法可以增加發現相似用戶的全面性和多樣性,提高發現相似用戶的準確性。
本發明所要解決的技術問題是通過以下的技術方案來產現的。本發明是一種微博中特定用戶的相似用戶監控方法,其特點是,其步驟如下:
A、根據輸入的特定用戶su得到擴展自我網絡EEN——ExtendedEgoNetwork的用戶集,記為EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su),其中FollowerCS(su)為su的關注集,FansCS(su)為su的粉絲集,VisitorCS(su)為su的訪客集;
其具體步驟如下:
A1、獲取時間片TimeSpan內用戶su的所有微博集MB-su,包括原創、轉發、評論的微博;
A2、獲取su的關注集FollowerCS(su)和粉絲集FansCS(su);
A3、根據su的微博集MB-su提取訪客集VisitorCS(su),將三類用戶記為EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su);
B、基于用戶的關注、粉絲和動態微博的相似度,以及用戶間的動態交互相互性,從EEN(su)中發現與su相似的用戶集SimUser(su)íEEN(su),其具體步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淮海工學院,未經淮海工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510363990.X/2.html,轉載請聲明來源鉆瓜專利網。