[發明專利]一種基于生成模型的無標度屬性網絡中的社團檢測方法在審
| 申請號: | 201910817986.4 | 申請日: | 2019-08-30 |
| 公開(公告)號: | CN110569897A | 公開(公告)日: | 2019-12-13 |
| 發明(設計)人: | 朱瑩瑩;戴維迪;焦鵬飛 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/18;G06Q50/00 |
| 代理公司: | 12201 天津市北洋有限責任專利代理事務所 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社團檢測 生成模型 標度 屬性網絡 網絡 貝葉斯 復雜網絡 拓撲結構 傳統的 建模 聯合 保留 優化 | ||
1.一種基于生成模型的無標度屬性網絡中的社團檢測方法,其特征在于,該方法包括如下步驟:
S1:屬性網絡的定義:
(1)將具有N個節點和M個屬性的屬性網絡G定義為一個N×N維的鄰接矩陣A和N×M的屬性矩陣X;
(2)鄰接矩陣A中aij=1表示節點vi和vj之間有連邊,aij=0表示vi和vj之間沒有連邊;
屬性矩陣X中xit=1表示節點vi具有第t個屬性wt;
S2:聯合貝葉斯生成模型:
(1)模型參數的定義:模型主要包括三種類型的變量:觀測變量、潛在變量和模型參數;
觀測變量:社團數目K,節點數目N,屬性數目M,鄰接矩陣A和屬性矩陣X;
潛在變量:社團標簽z,主題標簽g,度衰減變量δ;
模型參數:π=(πr)1×N,πr表示社團r中的節點所占的比例;
B=brr′)K×K,brr′表示社團r中的節點vi和社團r′中的節點vj連接的概率;η=(ηrs)K×K,ηks是節點vi屬于第r個社團,主題是s的概率;θ=(θst)K×M,θst是主題s生成屬性wt的概率;
(2)模型定義:聯合貝葉斯概率生成模型同時處理網絡的結構和節點的屬性;
a)為了建模網絡的結構,經典的隨機塊模型中節點vi和節點vj連接的概率是考慮到網絡中節點的無標度特性,對每一個節點vi引入了度衰減變量δi,用來表示節點vi和節點vj連接的概率;
b)定義參數η=(ηrs)K×K,模型中節點可以劃分為K個網絡社團和K個屬性社團,并且網絡社團和屬性社團并不一定是對齊的;
ηr代表了社團r的主題分布;
c)為了生成網絡中節點的屬性,當我們獲得節點vi的主題標簽gi之后,利用θs來生成節點的每一個屬性;
(3)模型的生成過程;
a)對于每一個節點vi,i∈{1,2…N};
i.從以π為參數的狄利克雷分布中生成每個節點的社團標簽zi;
ii.度衰減參數δi~Exp(λ);
iii.從以為參數的多項分布中生成每個屬性的主題標簽gi;
iv.對于每一個節點vj,并且vi≠vj;
從以為參數的伯努利分布中生成邊aij;
b)對于每個屬性wt并且xit=1;
i.從以為參數的多項分布中生成屬性wt;
S3:模型的優化過程:使用變分EM算法和平均場理論。
2.根據權利要求1所述的一種基于生成模型的無標度屬性網絡中的社團檢測方法,其特征在于,所述步驟S3具體:
(1)變分E步驟:最大化邊緣概率分布:
最小化參數的概率分布與真實的后驗分布之間的KL散度;
通過利用杰森不等式和泰勒優化公式得到似然函數的一個下界;
轉化為最大化這個下界(ELBO);
(2)M步:優化模型參數π,λ,B,θ,η;
步驟S1在構造屬性網絡時,對于獲得的數據,需要根據實體之間的關系構造出網絡,同時利用對實體的描述信息,需要抽取出每個實體的屬性,構造節點-屬性矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910817986.4/1.html,轉載請聲明來源鉆瓜專利網。





