[發明專利]基于位置學習圖卷積神經網絡的圖分類方法及系統在審
| 申請號: | 202110413687.1 | 申請日: | 2021-04-16 |
| 公開(公告)號: | CN113128587A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 沈華偉;王兆慧;曹婍;徐冰冰;岑科廷;程學旗 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 位置 學習 圖卷 神經網絡 分類 方法 系統 | ||
本發明提出一種基于位置學習圖卷積神經網絡的圖分類方法和系統,本發明目的是解決上述現有圖分類方法啟發式地對圖中節點進行排序、選擇的過程導致重要結構丟失和提取不到啟發式規則下的關鍵結構等問題。具體來說,本發明提出了一種基于位置學習卷積神經網絡的圖分類方法,核心思想是通過為圖上每個節點學習對應的位置,進而得到整個圖的表示。這種端到端的建模方式有效避免了對節點進行排序、選擇和丟棄的過程,不僅提升了圖分類的準確率,而且保證了對關鍵結構的有效提取。
技術領域
本發明屬于數據挖掘技術與社會網絡研究領域,涉及一種圖分類方法,具體涉及一種基于卷積神經網絡的圖級別特征提取和模式識別方法。
背景技術
隨著互聯網技術的蓬勃發展,圖數據廣泛出現在我們的生活中,圖數據不僅可以用于表示復合對象,還能表示復合對象中元素間的復雜關系。例如社交網絡、交通網絡、引文網絡,生物化學網絡等。圖分類任務是指給定一組圖,通過數據挖掘的方式找到圖和對應類別標簽的映射關系,進而預測每個圖的類別標簽的過程。圖分類作為一個重要的數據挖掘任務,可以應用在很多領域,包括金融科技、社會網絡分析、生物信息學、化學信息學等。例如,在化學信息學中,通過對分子圖進行分類來判斷化合物分子的誘變性、毒性、抗癌活性等;生物信息學中,通過蛋白質網絡分類判斷蛋白質是不是酶,是不是具有某種疾病的治療能力。
現有的圖分類方法主要包括兩大類。第一類是基于相似度計算的圖分類方法,基于相似度計算的圖分類方法是通過計算成對圖的相似度對圖進行分類,包括圖核方法和圖匹配方法。圖核方法通過圖核的定義來計算圖的相似度,圖核是圖的某種子結構(例如:子圖、子樹、路徑等),以圖核作為圖的特征計算圖的相似度,進而進行圖分類。圖匹配方法通過考慮跨圖因素計算圖之間的相似度分數,進而進行圖分類。早期的圖分類方法主要關注圖核方法,然而這種方法不夠靈活且通常計算代價較大,圖的特征提取過程和圖的分類是獨立進行的,因此無法針對具體任務進行優化。
第二類是基于圖神經網絡的圖分類方法。隨著深度學習在圖像、文本等領域的成功,研究人員開始關注用深度學習建模圖數據?;谏疃葘W習的圖數據建模方法也逐漸被應用于圖分類問題。其中,圖神經網絡應用于圖分類問題時,主要包括基于圖卷積神經網絡的方法和基于傳統卷積神經網絡的方法?;趫D卷積神經網絡的方法,假設圖上相鄰節點的標簽相同,采用鄰居信息傳遞機制獲得節點表示,然后利用池化算子對節點表示進行匯總得到整個圖的表示用于圖分類。這種方法著眼于節點角度,更適合圖上的節點分類任務?;趥鹘y卷積神經網絡的方法,先將圖數據表示為結構規則的歐式數據,然后在規則的歐式數據基礎上進行傳統的卷積,提取圖上特征,進而進行圖分類。這種方法具有提取關鍵結構的能力。
現有技術雖然給出了一些圖分類的方法,但仍然存在這一些明顯的不足:
1)基于圖核的圖分類方法中,特征的表示和分類的過程是分開進行的,無法針對具體的分類任務進行統一的優化。此外,圖核方法中,圖特征的表示需要一些先驗的、啟發式的特征,與圖上的結構特征進行對比,通常復雜度較高,無法應用到大規模的圖上。
2)基于圖卷積神經網絡的圖分類方法中,基于相鄰節點標簽相同的假設,利用信息傳遞的卷積求得節點表示后,用池化機制得到整個圖的表示。但已有研究指出,信息傳遞式圖卷積方法中,存在圖上節點信息過平滑的問題,基于信息傳遞式卷積得到的節點表示非常相似,因此后續池化方式的變化不能顯著的影響圖的表示和分類。
3)基于傳統卷積神經網絡的圖分類方法中,把圖結構轉化為歐式數據時,由于圖上的節點沒有確定的、統一的順序,已有的方法都是在一些啟發式的規則下對節點進行排序和選擇,直接丟失了圖上的一些結構,并且使得后續卷積得到的圖上重要結構可能是這種啟發式排序規則下的重要結構,而不是圖分類任務中所需要的重要結構。
因此,如何由圖數據得到包含豐富圖特征的圖表示,進一步進行圖的分類,是一個重要且亟待解決的問題。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110413687.1/2.html,轉載請聲明來源鉆瓜專利網。





