[發明專利]一種面向微博客平臺的社交朋友圈的挖掘方法及系統有效
| 申請號: | 201310143346.2 | 申請日: | 2013-04-23 |
| 公開(公告)號: | CN103279482A | 公開(公告)日: | 2013-09-04 |
| 發明(設計)人: | 程學旗;李靜遠;賀志明;伍大勇;王元卓 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 博客 平臺 社交 朋友圈 挖掘 方法 系統 | ||
技術領域
本發明涉及互聯網信息管理領域,尤其涉及一種面向微博客平臺的社交朋友圈的挖掘方法及系統。
背景技術
人們對社交關系有兩個最基本的需求,即關系拓展和關系維系。互聯網初期,因人們尚沉醉于互聯網前所未有的開放性,更多的互聯網應用是基于粗放型的關系拓展需求的,也就是基于多關系紐帶的泛關系的建立。如早期的BBS、聊天室等應用,其用戶多以個人偏好作為關系紐帶,而這些應用,也多是圍繞不同的偏好來建立不同的社交版塊。這時,關系拓展的作用要大于關系維系,也就是交友是基本的需求。
但隨著互聯網的進化,社交網絡給人們提供了跟蹤朋友、熟人和家人生活的方法之后,使用社交網絡的人數成指數級增長。社交網絡開始由關系拓展走向了關系維系,尤其是現實關系的維系。按照“鄧巴數字”的理論,人們可管理的強關系,是有限的。社交網站成了人們維系現實關系的工具。
隨著國外的facebook、twitter以及國內的人人、新浪微博等社交網絡平臺的逐步流行,如何從上億的海量用戶中自動挖掘親密朋友圈子成為了一個重要也非常必要的工作。所謂“親密朋友圈子”,指的是在同一SNS平臺上形成非常緊密的互相關注關系的,并且在線下也互相認識的人群,比如新浪微博里用戶有小學同學、中學同學、大學同學、以前的同事、現在的同事、家人、興趣團體等等社交圈子。對這些社交圈子的挖掘是很有實際用處的。
如果能夠從海量用戶中通過自動手段挖掘出一個個的興趣圈子,對于很多具體應用來說是非常重要的基礎數據,比如可以利用用戶所屬社交圈子進行人物推薦,或者根據所屬社交圈子的群體特性分析用戶的興趣點等,所以在SNS平臺下,如何對海量數據自動進行社交圈子挖掘是個非常有用的基礎功能。
發明內容
本發明的發明目的是提供一種面向微博客平臺的社交朋友圈的挖掘方法及系統,以在海量用戶中自動挖掘社交朋友圈子。
為實現上述發明目的,本發明的一種面向微博客平臺的社交朋友圈的挖掘方法,包括:
步驟1,通過微博客平臺所提供的數據接口得到待查看用戶的朋友列表;
步驟2,針對所述朋友列表中的每個朋友用戶,通過微博客平臺所提供的數據接口得到所述每個朋友用戶的朋友列表;
步驟3,計算所述待查看用戶的朋友列表與所述每個朋友用戶的朋友列表的鄰里相似度;
步驟4,取出鄰里相似度大于指定閾值(0.4-0.6)的朋友用戶,作為所述待查看用戶的現實朋友用戶(本發明認為在社交網絡上的現實朋友用戶是對應著用戶在線下相互認識的朋友);
步驟5,計算所述待查看用戶與所述現實朋友用戶所構成的有向連通圖中的最強連通子圖(也稱最大連通子圖,把圖的所有結點用最少的邊將其連接起來的子圖),所獲得的每個最強連通子圖構成所述待查看用戶的社交朋友圈。
進一步的,所述步驟3包括:
步驟31,取得所述待查看用戶的好友列表L(A),并且取得所述L(A)中的一位朋友用戶的好友列表L(B);
步驟32,計算所述L(A)和所述L(B)中相同的朋友用戶的個數M;
步驟33,計算所述L(A)和所述L(B)中的人數總和N;
步驟34,通過M/N計算所述待查看用戶和所述L(B)中的一位朋友用戶的鄰里相似度;
步驟35,重復執行步驟31至步驟34,直至計算出所述待查看用戶與所述每個朋友用戶的朋友列表的鄰里相似度。
進一步的,所述步驟5包括:
步驟51,將所述待查看用戶和每個現實朋友用戶作為一個單獨結點,所述待查看用戶和每個現實朋友的朋友列表中的朋友用戶之間的關系當作邊,組成有向連通圖;
步驟52,從所述有向連通圖的任意一個頂點出發,沿以該頂點為尾的邊,進行深度優先搜索遍歷,并按其所有鄰接點的搜索的完成順序排列頂點;
步驟53,從最后完成搜索的頂點出發,沿著以該頂點為頭的弧作逆向的深度優先遍歷,遍歷所述有向連通圖中的所有頂點,若此次遍歷不能訪問到所述有向聯通圖中所有頂點,則從其余頂點中最后完成搜索的頂點出發,繼續作逆向的深度優先遍歷,直至遍歷所述有向連通圖中的所有頂點;
步驟54,每一次作逆向深度優先遍歷所訪問的頂點集作為所述有向聯通圖中的一個最強連通子圖的頂點集。
為實現上述發明目的,本發明還提供一種面向微博客平臺的社交朋友圈的挖掘系統,該系統包括:
第一列表獲取模塊,通過微博客平臺所提供的數據接口得到待查看用戶的朋友列表;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310143346.2/2.html,轉載請聲明來源鉆瓜專利網。





