[發明專利]一種基于聚集圖的表示學習方法在審
| 申請號: | 202010126728.4 | 申請日: | 2020-02-28 |
| 公開(公告)號: | CN111309980A | 公開(公告)日: | 2020-06-19 |
| 發明(設計)人: | 游進國;周林娥;李曉武 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/9535 |
| 代理公司: | 昆明人從眾知識產權代理有限公司 53204 | 代理人: | 王娟 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聚集 表示 學習方法 | ||
本發明涉及一種基于聚集圖的表示學習方法,屬于聚集圖技術領域。本發明首先利用圖聚集算法同時考慮分組間及分組內的結構得到最終的聚集圖;其次,在聚集圖上計算隨機游走的轉移概率,然后選擇每個具有偏差概率的后繼節點并生成節點序列;最后將節點序列輸入到skip?gram學習用戶的潛在表示,獲得節點的表示向量。本發明一定程度上減輕了數據稀疏性并保持圖數據中的網絡結構相似性及降低計算復雜度同時增強表示向量在任務上的效果。
技術領域
本發明涉及一種基于聚集圖的表示學習方法,屬于聚集圖技術領域。
背景技術
隨著信息技術的發展以及人們產生的數據越來越多,比如:利用社交媒體進行交流、瀏覽網頁以及一些購物網站等產生大量的數據。很多事物之間的關系都可以用網絡表示出來,比如用戶與用戶之間及用戶與項目之間存在各種關系都可以表示成一個網絡,這樣表示的好處是為了后期進行各種任務的挖掘。現有的網絡表示學習方法主要有三種即:1)基于矩陣分解的方法如普聚類等,通常基于矩陣的方法都需要對特定矩陣進行分解如使用SVD分解;2)基于生成模型的算法如LINE等,根據網絡結構建立一個概率分布通過一些技術建立目標函數進而進行優化;3)基于深度學習的算法如deepwlk等,定義一個目標函數,利用深度學習模型進行學習如自編碼器。
然而,這些方法仍然存在一些極限性:首先,只考慮網絡拓撲結構的基本信息未考慮真實網絡節點本身的信息;其次,不能同時兼顧邊和節點的信息;最后,當前的網絡表示學習方法未考慮空間存儲的局限性及隱私保護方面。
發明內容
本發明要解決的技術問題是提供一種基于聚集圖的表示學習方法,用以解決上述問題。
本發明的技術方案是:一種基于聚集圖的表示學習方法,首先通過圖聚集技術獲取聚集圖數據;其次,在聚集圖上進行隨機游走捕獲節點的信息并生成序列;最后,把節點序列輸入到skip-gram進行嵌入得到表示向量。
具體步驟為:
Step1:獲取聚集圖數據;
Step2:在聚集圖上計算隨機游走的轉移概率;
Step3:選擇每個具有偏差概率的后繼節點并生成節點序列;
Step4:將節點序列輸入到skip-gram學習用戶潛在表示。
進一步的,所述Step1具體為,利用圖聚集技術將原圖中的數據分成k個超點,最終結果邊上的權重表示兩點之間鏈接的概率,從而得到聚集圖數據。
進一步的,所述Step2中轉移概率的目標函數為:
式中,Zu代表每個節點的函數,f(u)是將頂點u映射為嵌入向量的映射函數。
本發明的有益效果是:
1、本發明設計了一種聚集圖上的隨機游走方案并進行網絡表示學習,更符合邊稀疏的真實網絡;
2、該方法方便并且能有效的隨機游走選擇鄰居節點,捕捉網絡中節點的信息。進一步提升在低維嵌入中捕獲的網絡拓撲結構效果;
3、本發明同時考慮了存儲空間和隱私問題更適用于大規模的網絡結構的表示。
附圖說明
圖1是本發明的步驟流程圖;
圖2是本發明中聚集圖的同構性及鄰近性展示圖;
圖3是本發明中聚集圖上的表示學習執行示意圖。
具體實施方式
下面結合附圖和具體實施方式,對本發明作進一步說明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010126728.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高磷摻雜N型截止環結構的肖特基二極管及制備方法
- 下一篇:印制電路板





