[發明專利]一種微博數據管理系統及其實現方法有效
| 申請號: | 201310367762.0 | 申請日: | 2013-08-21 |
| 公開(公告)號: | CN103488683A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 王靜遠;高飛;李超;歐陽元新;熊璋 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 賈玉忠 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據管理 系統 及其 實現 方法 | ||
技術領域
本發明涉及一種基于社區發現技術的微博數據管理系統及其實現方法,屬于數據挖掘技術領域。?
背景技術
在微博等社交網絡中,隨著用戶好友數量的增多,用戶每天面對大量的信息。對于用戶較多微博用戶,一種好的數據管理的方法是,依據用戶在現實生活中的社交圈子,建立分組,根據好友所屬不同分組來管理。建立分組后,便可以依照組別進行內容過濾,隱私設置等。目前,騰訊微博、新浪微博等主要的微博服務提供商均提供了這種機制來管理數據。然而,現有的方法主要是通過用戶手工對好友進行分組管理來進行的。這種方法太過費時且需要用戶大量的人工勞動。當用戶有新的好友時,也難以更新。同時,手工的進行管理,存在著誤操作的可能性。?
發明內容
本發明的技術解決問題:克服現有技術的不足,提供一種微博數據管理系統及方法,可以高效、準確的挖掘出潛在的分組信息,用戶可以方便地管理其微博數據。?
本發明的技術解決方案:一種微博數據管理系統,如圖1所示包括:?
用戶授權模塊:采用Oauth協議進行授權。利用Oauth技術提供的安全機制,本系統不會接觸到用戶的隱私信息。?
數據抓取模塊:利用微博提供的API,獲取用戶好友之間的相互關系數據以及用戶資料信息的數據。首先對用戶的好友進行抓取。然后,對每一個好友,抓取其與用戶的共同好友信息,從而獲得所有好友之間的相互關系,形成一個由好友關系組成的用戶社交關系網絡。本模塊的輸入是用戶在微博上的用戶名,輸出是用戶社交關系網絡。其中,網絡中的每一個節點代表了用戶的一個好友,節點之間的邊代表了用戶兩個好友的關系。最終獲得的用戶社交關系網絡輸出到數據庫中,供社區結構檢測模塊調用;?
社區結構挖掘模塊:對數據抓取模塊獲得用戶好友關系組成的圖,依據社區檢測技術,從好友之間的社交關系中,挖掘出其潛在的社區結構,作為分組的依據。其中一個社區是一些好友的集合,其中社區內的好友間具有密度更大的好友關系,社區間的好友具有較少的好友關系。本模塊使用了社區檢測技術,由基本社區結構搜索和社區聚合兩部分組成。無需用戶設定任何參數,也無需任何參數。本模塊的輸入是數據抓取模塊獲得的好友關系網絡,經此模塊處理產生的好友分組輸出至分組解析展現模塊;?
分組解析展現模塊:根據社區結構發現模塊產生的用戶好友分組,對其進行解析。本模塊的作用在于智能的挖掘出分組的語義信息。根據用戶好友分組的語義信息,將組別抽象為名人明星、朋友、同學、同事四大類。解析模塊將?社區結構挖掘模塊產生的每一個分組,利用組內成員用戶資料、微博內容、轉發關系特征,決定其分組的類別。作為分組解析結果,展現社區結構挖掘模塊將解析模塊的結果展現給用戶。?
反饋模塊:對每一個用戶好友分組,設置一個反饋,收集用戶評價。使用戶對系統的效果做出打分評價,并收集用戶反饋信息,將用戶id、分組結果、用戶反饋作為一條記錄,存儲至數據庫,以便將來為系統改進、提高用戶體驗提供依據。?
一種微博數據管理方法,實現步驟為:?
(1)用戶授權:采用Oauth協議進行授權,得到用戶在微博上的用戶名;?
(2)數據抓取:根據用戶在微博上的用戶名,利用微博提供的API獲取用戶好友之間的相互關系數據以及用戶資料信息的數據,具體是首先對用戶的好友進行抓取;然后對每一個好友,抓取其與用戶的共同好友信息,獲得所有好友之間的相互關系,形成一個由好友關系組成的用戶社交關系網絡;其中,網絡中的每一個節點代表了用戶的一個好友,節點之間的邊代表了用戶兩個好友的關系,最終獲得的網絡輸出到數據庫中;?
(3)社區結構挖掘:對步驟(2)獲得的好友關系網絡,依據社區檢測技術,首先對網絡進行深度優先搜索挖掘出其基本社區結構,隨后對基本社區結構進行層級聚合,從好友之間的社交關系中,挖掘出其潛在的社區結構,作為分組的依據,其中一個社區是一些好友的集合,社區內的好友間具有密度更大的好友關系,社區間的好友具有較少的好友關系,從而得到用戶好友分組;?
(4)分組解析展現:根據步驟(3)產生的用戶好友分組,對其進行解析,本模塊的作用在于智能的挖掘出分組的語義信息。將組別抽象為名人明星、朋友、同學、同事四大類,根據步驟(3)產生的每一個用戶好友分組,利用組內成員用戶資料、微博內容、轉發關系特征,決定其分組的類別,作為分組依據展現給用戶;?
(5)進行反饋:對每一個用戶友好分組,設置一個反饋,收集用戶反饋信息,以便將來為系統改進、提高用戶體驗提供依據。?
本發明與現有技術相比的優點在于:?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310367762.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:視頻廣告播放方法、設備和系統
- 下一篇:播放控制系統和方法





