[發明專利]動態異質網絡演化聚類分析方法在審
| 申請號: | 201811270756.2 | 申請日: | 2018-10-29 |
| 公開(公告)號: | CN109543033A | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 戴維迪;李勝男 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/332 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 異質網絡 聚類 領域研究 分析 網絡 研究 聚類分析 聚類結果 領域知識 期刊數據 數據字段 演化趨勢 異構網絡 意義詞 構建 字段 合并 發現 | ||
本發明公開一種動態異質網絡演化聚類方法,主要步驟有,首先研究數據的數據及處理:具體為確定所需研究領域,獲取期刊數據;提取研究字段;對獲取得數據字段進行提取研究主題,消除無意義詞以及常用詞。其次是動態異質網絡演化聚類。本發明構建動態異質網絡的演化聚類框架,旨在對異構網絡進行演化分析。通過對其進行分析,得到不同時刻的書目網絡的聚類結果,從而可以分析不同類型實體之間的演化趨勢,發現網絡的出現、消失、合并、分離等演化行為。最后結合現有領域知識,分析網絡演化原因與未來發展趨勢。通過對書目網絡進行全面的分析,可以為領域研究提供有價值的信息,指導未來領域研究發展。
技術領域
本發明屬于復雜網絡領域,具體涉及一種動態異質網絡演化聚類分析方法。
背景技術
近年來,隨著諸如社交網絡、生物網絡、書目網絡等網絡規模的不斷擴大,研究人員從不同的角度對這些網絡進行研究。這些網絡有共同的屬性,即它們包含不同類型的實體。與廣泛研究的同構信息網絡相比,異構網絡包含了全面的結構信息和豐富的語義信息,為數據挖掘任務提供了新的機遇。與傳統的聚類方法不同,動態異構信息網絡考慮了不同對象的類型,對不同類型節點進行聚類分析,并分析其演化行為,使得分析結果更具有一般性。
發明內容
本發明的目的在于克服現有技術的不足,提供一種動態異質網絡演化聚類方法。
本發明為解決上述背景技術中提出的技術問題,采用的技術方案是:動態異質網絡演化聚類方法,該方法包括如下步驟:
S1:研究數據的獲取及處理:
(1)確定需要研究的領域,提取領域期刊數據;
(2)提取所需研究字段;
(3)對獲取的字段進行預處理;
S2:動態異質網絡演化聚類:
(1)對預處理所得的數據,確定不同時間片的網絡快照;
(2)在第一個時刻,根據經驗知識確定先驗概率,將網絡初始化為k類,在其他時刻,先驗概率為將前一時刻的聚類作為下一時刻的先驗分布;
(3)為每個聚類建立基于排序的概率生成模型,即可以通過調整相應聚類中對象的類型類分解相應的概率;
(4)為每種對象類型計算后驗概率P(ck|o),可以通過以下方式來計算:
pt(ck|o)∝p(o|ck)×pt(ck);
(5)一旦后驗概率計算完成,對象o可以使用一個向量進行表示v0=(P(c1|o),P(c2|o),...,P(cK|o)),通過使用先前的聚類分配,聚類之心的向量v為該聚類對象的平均值,通過使用v0和聚類質心之間的余弦相似度值,將對象o重新分配到每個聚類中;
(6)迭代第三步和第四步,直到聚類結果不會發生變化;
(7)返回聚類結果,并根據聚類結果,分析每個時間片的成員聚類,通過結合現有知識,分析產生聚類的原因,進一步了解發展現狀,指導未來研究。
本發明步驟S1(1)中確定需要研究的領域提取領域期刊數據。
本發明步驟S1(2)中研究字段包括論文、作者、時間、發表期刊/會議,主題詞字段。
本發明步驟S1(3)中預處理包括去除無意義詞和重復詞。
有益效果
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811270756.2/2.html,轉載請聲明來源鉆瓜專利網。





