[發明專利]一種復雜網絡拓撲圖表示學習方法、預測方法及服務器在審
| 申請號: | 202110198812.1 | 申請日: | 2021-02-22 |
| 公開(公告)號: | CN113065649A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 劉冰;李洪濤;馬永征;楊學 | 申請(專利權)人: | 中國互聯網絡信息中心 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04;G06N3/06 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 復雜 網絡 拓撲 圖表 學習方法 預測 方法 服務器 | ||
本發明公開了一種復雜網絡拓撲圖表示學習方法、預測方法及服務器。本發明的表示學習方法,其步驟包括:1)從復雜網絡拓撲圖結構數據中提取鄰接矩陣A和特征矩陣X;2)將鄰接矩陣A中設定位置的節點按一定概率p置0,得到加噪后的鄰接矩陣A′;3)將鄰接矩陣A′和特征矩陣X輸入到圖神經網絡中,得到各節點的嵌入表示并對其進行稀疏化處理后輸入到圖神經網絡的解碼模塊;4)解碼模塊重構復雜網絡拓撲圖,然后利用添加稀疏性約束的損失函數使重構復雜網絡拓撲圖的鄰接矩陣與原始復雜網絡拓撲圖的鄰接矩陣盡可能相近,通過不斷學習自編碼器參數最終得到有效的圖節點嵌入表示。本發明提高了模型泛化能力,進而能夠提升目標任務的準確率。
技術領域
本發明涉及一種基于無監督圖自編碼器的復雜網絡拓撲圖表示學習方法、預測方法及服務器,屬于計算機軟件技術領域。
背景技術
復雜網絡拓撲圖數據有著復雜的結構,比如在自治系統AS(Autonomous System)中,兩兩之間存在著密不可分的關聯關系,頂點與頂點直接通過邊相互銜接,使不同頂點具備多樣化的屬性類型,以及多層面的學習任務,要充分利用圖數據頂點之間密切連接的優勢,就需要一種高效的圖數據表示方法,因此,基于復雜網絡拓撲圖的圖表示學習已經成為圖學習領域中十分熱門的研究課題之一。
目前,基于復雜網絡拓撲圖的圖表示學習主要有三類方法:1)基于分解的方法:通過描述復雜網絡圖數據結構信息的矩陣進行矩陣分解,將節點轉化到低維向量空間中去,同時保留結構上的相似性。一般來說,這類方法均有解析解,但是由于結果依賴于相關矩陣的分解計算,因此,這類方法具有很高的時間復雜度和空間復雜度;2)基于隨機游走的方法:通過將圖轉化為序列的方式從而實現了大規模圖的表示學習,但將圖轉化成序列集合,復雜網絡拓撲圖本身的結構信息沒有辦法被充分利用,同時該學習框架很難融合圖中的屬性信息進行表示學習;3)基于深度學習的方法,其典型代表是基于圖神經網絡GNN的相關方法:通過聚合節點自身特征和鄰居節點的特征獲得節點的嵌入表示,能夠非常自然地融合圖的屬性信息進行學習,在多個圖數據相關任務上都取得了較好的成績,充分顯示出了其強大的表示學習能力,為圖嵌入學習帶來了新的建模方法。但在實際的應用場景中,大量的數據標簽往往具有很高的獲取門檻,研究如何對圖數據進行高效地無監督表示學習將具有十分重要的價值。
發明內容
針對現有技術中存在的技術問題,本發明的目的在于提供一種基于無監督圖自編碼器的復雜網絡拓撲圖表示學習方法、預測方法及服務器。
本發明解決原始數據無標簽或標簽數據較少的問題,同時在無節點屬性信息的情況下也能學習到較好的圖節點表示結果,用于下游鏈路預測或圖生成等任務。本發明通過基于PageRank算法的DropEdge策略,在訓練圖神經網絡時對輸入的原圖數據加噪,迫使模型從基于圖結構信息的加噪數據中提取有用的信息用于恢復原數據,從而增強模型的學習能力,提高學習到的圖嵌入表示的魯棒性,同時解決過平滑引起的模型參數難以調優的問題。
本發明在圖自編碼器訓練優化階段,基于高維而稀疏(只有有限的非零元素)的表示是更好的特征表達的啟發式知識,引入一個稀疏性約束作為一個正則懲罰項加入到損失函數中,對整個自編碼器網絡的稀疏性進行正則化約束,使圖自編碼器學習到圖數據的稀疏表征。即在同一時間只激活一小部分神經元,即使在隱藏神經元數量較多的情況下仍然可以發現輸入數據中一些有價值的內部結構信息,并可以將大量冗余或噪聲特征去除,提高模型的泛化能力,降低模型過擬合的風險。
本發明的技術方案為:
一種復雜網絡拓撲圖表示學習方法,其步驟包括:
1)從復雜網絡拓撲圖結構數據中提取鄰接矩陣A和特征矩陣X;
2)將鄰接矩陣A中設定位置的節點按一定概率p置0,抹去一部分邊信息或邊權重值,得到加噪后的鄰接矩陣A′;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國互聯網絡信息中心,未經中國互聯網絡信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110198812.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動分線裝置
- 下一篇:一種500MPa級高強抗震結構鋼及其生產方法





