[發明專利]一種基于網絡鏈接和節點屬性信息的節點嵌入方法在審
| 申請號: | 202011319384.5 | 申請日: | 2020-11-23 |
| 公開(公告)號: | CN112286996A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 單虹毓;杜樸風;焦鵬飛;金弟 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N3/08 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 張建中 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡 鏈接 節點 屬性 信息 嵌入 方法 | ||
本發明公開了一種基于網絡鏈接和節點屬性信息的節點嵌入方法,該方法包括:構建由圖自編碼器、先驗生成模型和網絡導向約束模塊構成的神經網絡模型;圖自編碼器將網絡數據映射到隱變量空間中,生成隱變量空間分布函數;先驗生成模型將隱變量空間分布通過歸一化流模型映射到高斯分布并生成新變量;其基于隱變量與新變量間的kl散度,優化和更新兩者空間分布,其將隱變量的多個空間分布函數組合成一組合分布函數;網絡導向約束模塊通過拉普拉斯特征映射方式對組合分布函數進行約束;采用訓練完成的模型對網絡數據進行處理,得到節點特征參數,將節點特征參數與該網絡數據相結合,形成帶有節點特征參數的網絡數據。本發明能夠獲得高質量的節點表示。
技術領域
本發明涉及數據挖掘領域,特別涉及一種基于網絡鏈接和節點屬性信息的節點嵌入方法。
背景技術
目前,在數據挖掘領域網絡嵌入是一個重要的任務。它是許多網絡分析任務的基礎,例如節點群集,節點分類和圖形可視化。網絡嵌入旨在學習每個節點的低維潛在表示,同時保留網絡中節點之間的關系。近年來,已經提出了各種網絡嵌入方法。其中基于拓撲的方法認為只能獲取網絡的拓撲信息,網絡嵌入通常的方法是保留盡可能多的拓撲信息;除了拓撲信息之外,網絡的屬性信息也被認為是網絡嵌入的有用來源。許多網絡嵌入方法使用這兩種類型的信息來提高網絡嵌入的質量,例如隨機游走、矩陣分解、深度學習等。尤其是采用深度學習技術的自動編碼器,其工作原理是學習數據的編碼并從解碼中重建數據,其在處理大規模網絡時具有可伸縮性的優點。由于網絡嵌入的目標是探索和保留原始數據的潛在結構,目前帶有節點語義信息的網絡數據通常是高維且復雜的,因此基于自編碼器的方法很難發現數據的某些深層信息。為了解決這個問題,現有的改進方法采用變分自動編碼器,該方法是通過向自編碼器引入了一個潛在變量模型,假設由編碼器壓縮的潛變量遵循一定的先驗分布,可以通過觀察到的數據來推斷該分布參數。但是,現有的變分自編碼器模型通常允許潛在變量遵循固定分布,例如高斯分布,但是實際網絡通常具有許多復雜的結構特性,例如:一階/二階接近度、高階接近度(例如主題和共同體)、冪律等,它們表達了多峰特征,現有的變分自編碼器模型無法挖掘這些不符合固定分布的潛在變量信息。
發明內容
本發明為解決公知技術中存在的技術問題而提供一種基于網絡鏈接和節點屬性信息的節點嵌入方法。
本發明為解決公知技術中存在的技術問題所采取的技術方案是:一種基于網絡鏈接和節點屬性信息的節點嵌入方法,該方法為:構建由圖自編碼器、先驗生成模型和網絡導向約束模塊構成的神經網絡模型;圖自編碼器用于將包括網絡鏈接和節點屬性信息的網絡數據映射到隱變量空間中,對應生成隱變量的空間分布函數;先驗生成模型,其用于將隱變量的空間分布通過歸一化流模型映射到高斯分布并生成新變量;其計算隱變量分布函數與新變量分布函數之間的kl散度,并基于kl散度,優化和更新隱變量及新變量的空間分布,得到對應隱變量的多個空間分布函數,其將得到的多個空間分布函數組合成一個組合分布函數;網絡導向約束模塊用于通過拉普拉斯特征映射方式對組合分布函數進行約束;采集包括已知網絡鏈接和節點屬性信息的網絡數據,制成樣本集,從樣本集中抽取網絡數據樣本和相應的鄰接矩陣,對神經網絡模型進行訓練;采用訓練完成的神經網絡模型對未知網絡鏈接和節點屬性信息的網絡數據進行處理,得到對應該網絡數據的節點特征參數,將節點特征參數與該網絡數據相結合,形成帶有節點特征參數的網絡數據。
進一步地,該方法還包括:將所得節點放入分類器中進行訓練,并將訓練好的節點嵌入網絡數據中進行可視化表示。
進一步地,采用Adam優化器來最小化神經網絡模型的損失函數,并優化神經網絡模型的參數。
進一步地,對神經網絡模型進行訓練時,隨機初始化參數,利用Adam優化器優化所得的參數更新規則建立模型訓練過程,將網絡數據樣本放入神經網絡模型中訓練,不斷迭代,直至參數更新收斂。
進一步地,該方法包括如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011319384.5/2.html,轉載請聲明來源鉆瓜專利網。





