[發明專利]一種計算圖節點低維表征及相關應用方法在審
| 申請號: | 201910911795.4 | 申請日: | 2019-09-25 |
| 公開(公告)號: | CN110688537A | 公開(公告)日: | 2020-01-14 |
| 發明(設計)人: | 李金龍;吳鈺澤 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F17/16 |
| 代理公司: | 11260 北京凱特來知識產權代理有限公司 | 代理人: | 鄭立明;鄭哲 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖結構 向量 節點序列 節點屬性信息 拓撲結構信息 注意力 保留 矩陣 重要性參數 注意力機制 最大程度地 原始數據 自身信息 編碼器 互信息 圖節點 低維 應用 融合 挖掘 引入 分析 | ||
本發明公開了一種計算圖節點低維表征及相關應用方法,包括:根據圖結構原始數據,計算各節點的重要性參數,從而將整個圖結構用一系列的節點序列表示;利用一系列的節點序列計算圖結構的點互信息矩陣,并利用自編碼器進行初步編碼,獲得各節點的包含拓撲結構信息的向量表征;根據一系列的節點序列,引入注意力機制,計算各節點的包含注意力信息與節點屬性信息的向量表征;融合各節點的包含拓撲結構信息的向量表征,以及各節點的包含注意力信息與節點屬性信息的向量表征,得到各節點的保留自身信息的最終向量表征。該方法能夠最大程度地保留節點本身的信息,進而能夠保留整個圖結構的信息,實現對圖結構所表示的實際應用中的數據進行挖掘和分析的任務。
技術領域
本發明涉及計算機、人工智能、圖表征學習技術領域,尤其涉及一種計算圖節點低維表征及相關應用方法。
背景技術
許多學科和領域中的關系都可以自然地用圖結構來表示。例如:學術論文之間的引用關系構成了論文引用圖,在線社交平臺上的好友關系構成了社會關系圖,而基于現實數據得到的圖規模都十分龐大,因此為了能夠更好地解決基于圖結構的實際問題,對于圖的低維表示的學習至關重要。
目前對于圖結構的相關應用,已經有一些解決方案,例如CN2018100543114提出一種基于循環神經網絡的圖節點分類方法。但已有方法大多以節點的同質性為基礎,忽略節點之間的差異性,把圖中所有節點視為等同的個體來對待,因此,最終節點的表征結果只能保留節點的拓撲結構信息,也就是節點的連邊信息以及鄰居節點信息,無法很好的保留節點本身自帶的標簽、屬性等信息,進而影響在實際數據上的應用效果。
發明內容
本發明的目的是提供一種計算圖節點低維表征及相關應用方法,能夠最大程度地保留節點本身的信息,進而能夠保留整個圖結構的信息,實現對圖結構所表示的實際應用(例如,節點分類和連邊預測)中的數據進行挖掘和分析的任務。
本發明的目的是通過以下技術方案實現的:
一種計算圖節點低維表征及相關應用方法,包括:
根據圖結構原始數據,計算各節點的重要性參數,從而將整個圖結構用一系列的節點序列表示,得到節點序列集合;
利用得到節點序列集合計算圖結構的點互信息矩陣,并利用自編碼器進行初步編碼,獲得各節點的包含拓撲結構信息的向量表征;
根據得到節點序列集合,引入注意力機制,計算各節點的包含注意力信息與節點屬性信息的向量表征;
融合各節點的包含拓撲結構信息的向量表征,以及各節點的包含注意力信息與節點屬性信息的向量表征,得到各節點的保留自身信息的最終向量表征;
基于各節點的保留自身信息的最終向量表征,進行節點的分類和連邊預測。
由上述本發明提供的技術方案可以看出,通過自編碼器進行初步編碼,并引入注意力機制,從而將高維稀疏的網絡節點表示成低維稠密的向量,可以使圖結構中的節點在表示成低維向量的同時保留更多的信息,從而在實際數據上的應用中獲得更好的效果。
附圖說明
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域的普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他附圖。
圖1為本發明實施例提供的一種計算圖節點低維表征及相關應用方法的流程圖;
圖2為本發明實施例提供的自編碼器結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910911795.4/2.html,轉載請聲明來源鉆瓜專利網。





