[發(fā)明專利]一種基于集成學(xué)習(xí)的社會網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)方法有效
| 申請?zhí)枺?/td> | 201210371876.8 | 申請日: | 2012-09-27 |
| 公開(公告)號: | CN102929942A | 公開(公告)日: | 2013-02-13 |
| 發(fā)明(設(shè)計(jì))人: | 黃發(fā)良 | 申請(專利權(quán))人: | 福建師范大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 福州元創(chuàng)專利商標(biāo)代理有限公司 35100 | 代理人: | 蔡學(xué)俊 |
| 地址: | 350007 *** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 集成 學(xué)習(xí) 社會 網(wǎng)絡(luò) 重疊 社區(qū) 發(fā)現(xiàn) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種Web2.0下信息交互平臺中的重疊社區(qū)挖掘,特別是一種運(yùn)用集成學(xué)習(xí)理論的重疊社區(qū)發(fā)現(xiàn)方法,屬于社會網(wǎng)絡(luò)技術(shù)領(lǐng)域。
背景技術(shù)
社會網(wǎng)絡(luò)(Social?Network,簡稱SN)是一種用來表示社會個體成員互動關(guān)系的關(guān)系網(wǎng)絡(luò),廣泛存在于人類社會,有著諸如家庭、俱樂部、小區(qū)、城市等不同組織結(jié)構(gòu)的表現(xiàn)形式。迅猛發(fā)展的Web技術(shù)極大地豐富了社會網(wǎng)絡(luò)的表現(xiàn)形式,微博網(wǎng)絡(luò)、郵件網(wǎng)絡(luò)、BBS論壇網(wǎng)絡(luò)等各種社交網(wǎng)絡(luò)層出不窮。如何從這些紛繁蕪雜的社會網(wǎng)絡(luò)中發(fā)現(xiàn)隱藏的潛在有價值的社區(qū)結(jié)構(gòu)模式,成為了一個吸引縱多學(xué)者參與的熱門研究方向。
社區(qū)結(jié)構(gòu)模式的一個顯著特點(diǎn)就是社區(qū)內(nèi)部節(jié)點(diǎn)連接緊密而社區(qū)間連接松散,這一特點(diǎn)誘導(dǎo)出大量的社會網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)方法。一般來說,根據(jù)社區(qū)之間是否允許重疊可以將社區(qū)發(fā)現(xiàn)方法分為兩類,第一類方法假定社會網(wǎng)絡(luò)個體只屬于某個社區(qū),利用各種硬聚類算法把社會網(wǎng)絡(luò)個體劃分到互不重疊的社區(qū)。例如,基于劃分聚類的K-Means方法、基于邊聚集系數(shù)的GN分割方法、基于代數(shù)圖論的SM譜聚類方法、等等。此類方法忽略了由于社會網(wǎng)絡(luò)個體可以同時隸屬于多個不同社區(qū)而導(dǎo)致的社區(qū)重疊性,?從而無法發(fā)現(xiàn)社會網(wǎng)絡(luò)中隱藏的真實(shí)社區(qū)結(jié)構(gòu)。例如,根據(jù)微博者所發(fā)微博的主題可以將微博者劃分到不同的微群社區(qū),不同微群社區(qū)之間存在著相同的微博者。第二類方法消除了第一類方法中的假設(shè),能夠發(fā)現(xiàn)社會網(wǎng)絡(luò)的重疊社區(qū)結(jié)構(gòu)。例如,Palla等人首先提出通過滾動K完全圖來發(fā)現(xiàn)重疊社區(qū)的CPM方法,沈華偉等人提出利用層次聚類思想來實(shí)現(xiàn)重疊社區(qū)發(fā)現(xiàn)的EAGLE算法,Magdon-Ismail等人提出基于譜聚類思想的重疊社區(qū)發(fā)現(xiàn)算法SSDE。此類方法中的現(xiàn)有算法具有計(jì)算復(fù)雜度高、結(jié)果社區(qū)質(zhì)量偏低等不同缺陷,不能很好地應(yīng)用于實(shí)際社會網(wǎng)絡(luò)的重疊社區(qū)挖掘。
總之,現(xiàn)有技術(shù)中雖然存在著從社會網(wǎng)絡(luò)中發(fā)現(xiàn)社區(qū)的相關(guān)方法,但這些方法不是無法反應(yīng)社區(qū)的重疊屬性,就是具有影響其實(shí)際應(yīng)用的多種缺陷,因而不適合從社會網(wǎng)絡(luò)中發(fā)現(xiàn)重疊社區(qū)。
發(fā)明內(nèi)容
本發(fā)明的目的是為了克服現(xiàn)有技術(shù)中的社區(qū)發(fā)現(xiàn)方法不能快速有效地發(fā)現(xiàn)社會網(wǎng)絡(luò)重疊社區(qū)結(jié)構(gòu)的缺陷,提供一種基于集成學(xué)習(xí)的社會網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于集成學(xué)習(xí)的社會網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)方法,應(yīng)用于Web2.0下的社交網(wǎng)絡(luò),其特征在于,所述方法綜合集成學(xué)習(xí)策略與譜聚類方法實(shí)現(xiàn)社會網(wǎng)絡(luò)的重疊社區(qū)發(fā)現(xiàn),包括以下步驟:
A.運(yùn)用快速譜聚類方法KASP計(jì)算獲取社會網(wǎng)絡(luò)的Λ種社區(qū)劃分方案;
B.運(yùn)用CCChooser選擇方法從各種社區(qū)劃分候選方案中選擇出待聚合的????????????????????????????????????????????????種社區(qū)劃分方案,其中;
C.對待聚合社區(qū)劃分方案中的社區(qū)進(jìn)行層次軟聚類,?輸出最優(yōu)截?cái)帱c(diǎn)對應(yīng)的生成簇作為網(wǎng)絡(luò)重疊社區(qū)結(jié)構(gòu)。
本發(fā)明的有益效果是:比起傳統(tǒng)的社區(qū)發(fā)現(xiàn)方法,本發(fā)明提出的方法能將各種社區(qū)劃分方案所具有的合理成分進(jìn)行充分利用并有效集成,可以發(fā)現(xiàn)與網(wǎng)絡(luò)社區(qū)真實(shí)結(jié)構(gòu)更相符合的社區(qū)結(jié)構(gòu)。本發(fā)明應(yīng)用于以微博網(wǎng)絡(luò)、郵件網(wǎng)絡(luò)、BBS論壇網(wǎng)絡(luò)等各種社交平臺,可以優(yōu)化信息網(wǎng)絡(luò)結(jié)構(gòu)、提升信息主動服務(wù)質(zhì)量、增強(qiáng)網(wǎng)絡(luò)文化安全等。
附圖說明
圖1為本發(fā)明的基于集成學(xué)習(xí)的社會網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)方法的總流程圖;
圖2為本發(fā)明方法發(fā)現(xiàn)的社會網(wǎng)絡(luò)karate的重疊社區(qū)結(jié)構(gòu);
圖3為本發(fā)明方法發(fā)現(xiàn)的社會網(wǎng)絡(luò)dolphins的重疊社區(qū)結(jié)構(gòu);
圖4為本發(fā)明方法發(fā)現(xiàn)的社會網(wǎng)絡(luò)HLM的重疊社區(qū)結(jié)構(gòu);
圖5在大小為5000的第一類網(wǎng)絡(luò)上尺度參數(shù)對本發(fā)明方法有效性的影響;
圖6在大小為5000的第二類網(wǎng)絡(luò)上尺度參數(shù)對本發(fā)明方法有效性的影響;
圖7在大小為10000的第一類網(wǎng)絡(luò)上壓縮比對本發(fā)明方法有效性的影響;
圖8在大小為10000的第二類網(wǎng)絡(luò)上壓縮比對本發(fā)明方法有效性的影響。
具體實(shí)施方式:
下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明予以說明。
為了方便詳細(xì)闡述本發(fā)明,首先統(tǒng)一說明相關(guān)基本概念。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建師范大學(xué),未經(jīng)福建師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210371876.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





