[發明專利]一種基于超圖點匹配的分子網絡分類方法及系統在審
| 申請號: | 202110378059.4 | 申請日: | 2021-04-08 |
| 公開(公告)號: | CN113033692A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 陳子健;李榮華;秦宏超;王國仁 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京方圓嘉禾知識產權代理有限公司 11385 | 代理人: | 馮靜 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 超圖 匹配 分子 網絡 分類 方法 系統 | ||
本發明公開了一種基于超圖點匹配的分子網絡分類方法及系統。包括:獲取多個分子網絡的超圖;超圖包括有標簽超圖和無標簽超圖;對有標簽超圖和無標簽超圖進行超邊擴展,得到有標簽圖和無標簽圖;通過圖遍歷的方法對有標簽圖和無標簽圖中每個結點生成深度子樹;得到有標簽子樹集合和無標簽子樹集合;采用結點采樣方法進行多次采樣,得到多個有標簽匹配點集和多個無標簽匹配點集;根據有標簽子樹集合、無標簽子樹集合、多個有標簽匹配點集和多個無標簽匹配點集,計算有標簽超圖和無標簽超圖之間的相似度;根據有標簽超圖和無標簽超圖之間的相似度對無標簽超圖進行分類。本發明使用超圖的比較方法更容易對分子網絡進行比較,從而對分子網絡進行分類。
技術領域
本發明涉及分子網絡分類領域,特別是涉及一種基于超圖點匹配的分子網絡分類方法及系統。
背景技術
隨著信息技術的發展,圖數據在生活中處處皆是,例如:社交網絡、引文網絡、金融風險網絡等等。對圖的聚類分析是網絡分析中的一個基礎問題,例如:對不同分子網絡進行聚類、分類,從而識別分析出化學藥物的藥性和毒性,在金融風險網絡中對子圖進行分類,識別子網絡是否是洗錢、擔保借貸等異常行為。超圖是傳統圖的一種推廣,在超圖中,邊不再是二元關系的連接,也就是邊不再是只連接兩個點,而是一個可以包含多個節點的集合。這種推廣擴展了傳統圖的局限性。在蛋白質分子網絡中,往往會出現兩種以上的蛋白質分子交互作用,使用超圖則更容易表示。
現有的分類技術包括基于圖核的方法以及基于圖神經網絡的方法等等。基于圖核的方法往往是根據分子網絡建立的圖,采用一些傳統的模型對其進行分類,比較常見的有基于k-核分解比較圖相似度的方法,并在此基礎上進行分類。基于圖神經網絡的方法,往往是將分子網絡形成的圖的特征作為輸入,根據圖神經網絡的訓練迭代,再加上一層全連接層作為分類層從而得到分類結果,常用的圖神經網絡有圖卷積網絡和圖注意力網絡等等。但是這些方法都是基于傳統圖的,受限于圖中邊的二元結構,不能夠更好地表達分子網絡中的多元作用關系。
發明內容
本發明的目的是提供一種基于超圖點匹配的分子網絡分類方法及系統,使用超圖的比較方法更容易對分子網絡進行比較,從而對分子網絡進行分類,從而發現其功效。
為實現上述目的,本發明提供了如下方案:
一種基于超圖點匹配的分子網絡分類方法,包括:
獲取多個分子網絡的超圖;所述超圖包括有標簽超圖和無標簽超圖;
對所述有標簽超圖和所述無標簽超圖進行超邊擴展,得到有標簽圖和無標簽圖;
通過圖遍歷的方法對有標簽圖和無標簽圖中每個結點生成深度子樹;得到有標簽子樹集合和無標簽子樹集合;
采用結點采樣方法進行多次采樣,得到多個有標簽匹配點集和多個無標簽匹配點集;
根據有標簽子樹集合、無標簽子樹集合、多個有標簽匹配點集和多個無標簽匹配點集,計算有標簽超圖和無標簽超圖之間的相似度;
根據有標簽超圖和無標簽超圖之間的相似度對無標簽超圖進行分類。
進一步地,所述超邊擴展包括星擴展和團擴展。
進一步地,所述根據有標簽子樹集合、無標簽子樹集合、多個有標簽匹配點集和多個無標簽匹配點集,計算有標簽超圖和無標簽超圖之間的相似度,具體包括:
計算有標簽子樹集合和無標簽子樹集合中相同子樹的深度;
根據所述深度計算每一個有標簽匹配點集和每一個無標簽匹配點集的相似度;
對所有有標簽匹配點集和所有標簽匹配點集的相似度求平均得到有標簽超圖和無標簽超圖之間的相似度。
進一步地,所述根據所述深度計算每一個有標簽匹配點集和每一個無標簽匹配點集的相似度,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110378059.4/2.html,轉載請聲明來源鉆瓜專利網。





