[發(fā)明專利]一種網(wǎng)絡(luò)局部社團(tuán)挖掘方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810141629.6 | 申請(qǐng)日: | 2018-02-11 |
| 公開(公告)號(hào): | CN108427724A | 公開(公告)日: | 2018-08-21 |
| 發(fā)明(設(shè)計(jì))人: | 徐小龍;胡楠 | 申請(qǐng)(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 姜慧勤 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 社團(tuán) 挖掘 網(wǎng)絡(luò)局部 種子節(jié)點(diǎn) 分布式環(huán)境 擴(kuò)展性 網(wǎng)絡(luò) 普適性 集合 科研 | ||
本發(fā)明公開了一種網(wǎng)絡(luò)局部社團(tuán)挖掘方法,該方法能夠基于網(wǎng)絡(luò)中給定的初始種子節(jié)點(diǎn),挖掘出網(wǎng)絡(luò)中包含這些種子節(jié)點(diǎn)的局部社團(tuán),并最終給出這些局部社團(tuán)中所有節(jié)點(diǎn)的集合。本發(fā)明方法具有很好的普適性,能夠適用于社交、科研、生物、商品等各個(gè)領(lǐng)域的網(wǎng)絡(luò);而且本發(fā)明方法具有良好的擴(kuò)展性,可以適應(yīng)于分布式環(huán)境中的局部社團(tuán)挖掘。
技術(shù)領(lǐng)域
本發(fā)明涉及一種網(wǎng)絡(luò)局部社團(tuán)挖掘方法,屬于復(fù)雜網(wǎng)絡(luò)應(yīng)用技術(shù)領(lǐng)域。
背景技術(shù)
目前主流的挖掘局部社團(tuán)的方法是先將網(wǎng)絡(luò)進(jìn)行全局的社團(tuán)劃分,然后根據(jù)種子節(jié)點(diǎn)在全部劃分結(jié)果中查詢局部社團(tuán)節(jié)點(diǎn)。不同于現(xiàn)有主流的基于全局社團(tuán)劃分的局部社團(tuán)挖掘方法,基于局部信息的局部社團(tuán)挖掘算法更加符合現(xiàn)實(shí)中的應(yīng)用場(chǎng)景,而且能夠避免大量的全局迭代計(jì)算過程,節(jié)約計(jì)算資源。此外,目前的局部社團(tuán)挖掘方法并未給出分布式環(huán)境的計(jì)算模型,對(duì)于基于分布式環(huán)境的大規(guī)模網(wǎng)絡(luò)挖掘計(jì)算的適用性還不確定。
局部社團(tuán)挖掘算法的評(píng)價(jià)指標(biāo)主要包括準(zhǔn)確率、召回率以及綜合前兩者計(jì)算出的F值。其中,準(zhǔn)確率是指算法找出的節(jié)點(diǎn)集合中真正與種子節(jié)點(diǎn)從屬于同一局部社團(tuán)節(jié)點(diǎn)部分所占比例;召回率是指算法正確找出的節(jié)點(diǎn)數(shù)量占真正的所有和種子節(jié)點(diǎn)從屬于同一局部社團(tuán)的節(jié)點(diǎn)數(shù)量的比例;準(zhǔn)確率和召回率雖然能夠直觀的給出算法的挖掘效果,但是二者都存在一定的片面性,F(xiàn)值是一種綜合準(zhǔn)確率與召回率的評(píng)價(jià)指標(biāo),計(jì)算方式為:
上述公式中,Pre為準(zhǔn)確率,Rec為召回率。現(xiàn)有的局部社團(tuán)挖掘算法多是基于節(jié)點(diǎn)的度數(shù)確定節(jié)點(diǎn)的影響力,但是節(jié)點(diǎn)的度數(shù)并不能準(zhǔn)確的衡量該節(jié)點(diǎn)與社團(tuán)中其他節(jié)點(diǎn)的聯(lián)系緊密程度,而且存在“僵尸粉”這種人為手段增加節(jié)點(diǎn)的度數(shù),干擾算法對(duì)節(jié)點(diǎn)在社團(tuán)中重要程度的準(zhǔn)確判斷,從而在對(duì)種子節(jié)點(diǎn)進(jìn)行位置微調(diào)時(shí)出現(xiàn)較大偏差。
局部社團(tuán)挖掘的目標(biāo)是通過網(wǎng)絡(luò)中的極少比例的種子節(jié)點(diǎn)獲取與這些種子節(jié)點(diǎn)從屬于同一個(gè)網(wǎng)絡(luò)社團(tuán)的其他所有節(jié)點(diǎn)的過程。局部社團(tuán)挖掘方法能夠用于在建模為網(wǎng)絡(luò)的復(fù)雜系統(tǒng)中挖掘具有特定特征的節(jié)點(diǎn)群體,而且能夠適應(yīng)于分布式計(jì)算環(huán)境下大規(guī)模網(wǎng)絡(luò)的挖掘,對(duì)于當(dāng)今網(wǎng)絡(luò)承載信息出現(xiàn)爆炸性增長的現(xiàn)狀具有重要的意義。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是:提供一種網(wǎng)絡(luò)局部社團(tuán)挖掘方法,通過給定網(wǎng)絡(luò)中少量的種子節(jié)點(diǎn),實(shí)現(xiàn)對(duì)包含這些種子節(jié)點(diǎn)的局部社團(tuán)的挖掘,從而得到與種子節(jié)點(diǎn)在同一局部社團(tuán)的其他節(jié)點(diǎn)。
本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案:
一種網(wǎng)絡(luò)局部社團(tuán)挖掘方法,包括如下步驟:
步驟1,對(duì)網(wǎng)絡(luò)中的所有節(jié)點(diǎn)進(jìn)行編號(hào),且每個(gè)節(jié)點(diǎn)的編號(hào)唯一,并將節(jié)點(diǎn)的編號(hào)作為自身的id;
步驟2,設(shè)定網(wǎng)絡(luò)中的部分節(jié)點(diǎn)為種子節(jié)點(diǎn),并獲取各種子節(jié)點(diǎn)對(duì)應(yīng)的編號(hào);
步驟3,針對(duì)網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn),根據(jù)節(jié)點(diǎn)的度數(shù)和包含該節(jié)點(diǎn)的三角環(huán)數(shù),計(jì)算每個(gè)節(jié)點(diǎn)的關(guān)系密度值;
步驟4,基于高斯模糊算法的思想,對(duì)于網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn),計(jì)算其自身的關(guān)系密度值和鄰居節(jié)點(diǎn)的關(guān)系密度值的加權(quán)平均值,將加權(quán)平均的結(jié)果作為該節(jié)點(diǎn)的社團(tuán)中心性值;
步驟5,在網(wǎng)絡(luò)中,通過有指導(dǎo)的隨機(jī)游走,從各種子節(jié)點(diǎn)出發(fā)尋找附近S步數(shù)內(nèi)社團(tuán)中心性值最大的節(jié)點(diǎn),即各種子節(jié)點(diǎn)所在的局部社團(tuán)的中心節(jié)點(diǎn),S為可調(diào)參數(shù);
步驟6,從各局部社團(tuán)的中心節(jié)點(diǎn)出發(fā),挖掘出與種子節(jié)點(diǎn)在同一局部社團(tuán)的其他節(jié)點(diǎn),并輸出各種子節(jié)點(diǎn)所在的局部社團(tuán)中的所有節(jié)點(diǎn)。
作為本發(fā)明的一種優(yōu)選方案,步驟3所述關(guān)系密度值的計(jì)算公式為:
其中,R表示節(jié)點(diǎn)的關(guān)系密度值,t表示包含該節(jié)點(diǎn)的三角環(huán)數(shù),d表示節(jié)點(diǎn)的度數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810141629.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 基于重疊點(diǎn)識(shí)別的網(wǎng)絡(luò)重疊社團(tuán)檢測(cè)方法
- 一種基于動(dòng)態(tài)社團(tuán)識(shí)別的社交網(wǎng)絡(luò)交友推薦方法及系統(tǒng)
- 基于邊零模型的網(wǎng)絡(luò)邊社團(tuán)發(fā)現(xiàn)方法
- 一種基于APP的高校社團(tuán)管理系統(tǒng)
- 多網(wǎng)絡(luò)社群管理系統(tǒng)及其管理方法
- 一種基于節(jié)點(diǎn)表示的主題社團(tuán)發(fā)現(xiàn)方法
- 一種基于社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)分析社團(tuán)數(shù)據(jù)挖掘方法
- 一種Spark云服務(wù)環(huán)境下面的復(fù)雜網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)方法
- 一種供需網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)挖掘方法
- 一種基于前后端分離式架構(gòu)的社團(tuán)管理系統(tǒng)
- 信息處理設(shè)備、方法及程序
- 音頻網(wǎng)絡(luò)系統(tǒng)
- 用于使用備選連接接口自動(dòng)構(gòu)成局部網(wǎng)絡(luò)的方法和裝置
- 一種用于片上網(wǎng)絡(luò)的混合互連結(jié)構(gòu)、其網(wǎng)絡(luò)節(jié)點(diǎn)編碼方法及其混合路由算法
- 一種神經(jīng)網(wǎng)絡(luò)系統(tǒng)及基于該神經(jīng)網(wǎng)絡(luò)系統(tǒng)的車型識(shí)別方法
- 一種基于歷史拓?fù)錅y(cè)量數(shù)據(jù)的局部網(wǎng)絡(luò)目的IP地址選擇方法
- 神經(jīng)網(wǎng)絡(luò)參數(shù)初始化的方法和裝置
- 一種局部特征細(xì)粒度目標(biāo)檢測(cè)算法
- 一種信任數(shù)據(jù)更新方法及裝置
- 局部區(qū)域網(wǎng)絡(luò)
- 一種獲取種子信息的方法及P2P網(wǎng)絡(luò)中的超級(jí)節(jié)點(diǎn)和普通節(jié)點(diǎn)
- 引導(dǎo)會(huì)合聯(lián)盟
- 基于信息度量的移動(dòng)傳感器網(wǎng)絡(luò)主動(dòng)定位方法
- 一種分布式爬蟲URL種子分發(fā)方法、調(diào)度節(jié)點(diǎn)及抓取節(jié)點(diǎn)
- 一種移動(dòng)終端及網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)方法
- 一種基于并發(fā)進(jìn)程與影響力期望的傳播種子節(jié)點(diǎn)選擇方法
- 社交平臺(tái)用戶的現(xiàn)實(shí)關(guān)系匹配方法、裝置及可讀存儲(chǔ)介質(zhì)
- 基于節(jié)點(diǎn)活躍度的社交網(wǎng)絡(luò)信息傳播方法
- 一種基于隨機(jī)游走的種子節(jié)點(diǎn)確定方法及系統(tǒng)
- 一種基于約束的種子節(jié)點(diǎn)數(shù)據(jù)挖掘系統(tǒng)





