[發明專利]一種基于圖結構數據特征的生物信息學分類模型有效
| 申請號: | 202310659097.6 | 申請日: | 2023-06-06 |
| 公開(公告)號: | CN116416478B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 魏玉鋅;王翔 | 申請(專利權)人: | 福建工程學院 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/40;G06V10/80;G06V10/82;G16B40/00;G06N3/0464;G06N3/08 |
| 代理公司: | 福州市京華專利代理事務所(普通合伙) 35212 | 代理人: | 王美花 |
| 地址: | 350000 福建省福州*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 結構 數據 特征 生物 信息學 分類 模型 | ||
本發明提供一種基于圖結構數據特征的生物信息學分類模型,包括若干個逐級堆疊的特征提取層;任一特征提取層包括一圖卷積層和一圖池化層;圖池化層包括一個三通道池化模塊和一個特征融合模塊,三通道池化模塊包括圖卷積池化通道、微分池化通道和Transformer池化通道,分別用于學習圖結構數據的局部拓撲結構信息、全局拓撲結構信息以及節點間特征的依賴信息并進行融合;任一前級的特征提取層所得的池化圖由對應的讀出層提取圖特征表示后與最后一級特征提取層經由對應的讀出層提取的圖特征表示構成殘差連接,再由全連接層輸出生物信息學分類的預測結果。由于本發明能將多種圖特征信息融合在一起,能更好的生成整個圖的特征表示,使分類更為準確。
技術領域
本發明涉及數據處理技術領域,特別涉及一種基于圖結構數據特征的生物信息學分類模型。
背景技術
在現實生活中,存在大量復雜網絡數據,如社交網絡、知識圖譜、蛋白質、病毒、購物網絡、分子化合物等,這些數據可以被抽象為一個圖。與傳統的數據類型相比,圖結構數據具有更為復雜的結構和更高的維度,因此對圖結構數據的分析和處理也具有更高的挑戰性。而深度學習在處理圖結構數據方面也表現出了強大的學習能力,因此近年來,越來越多的研究者將深度學習應用于圖結構數據分析和處理的領域,如推薦系統、鏈路預測、圖分類、節點分類等領域。
圖分類任務主要應用于生物信息學分類,包括藥物發現,病毒分析、蛋白質分析和分子化合物分析等領域。與圖像分類不同,這些復雜網絡數據存在大量拓撲結構信息,這些拓撲結構信息對生成整個圖的圖級表示具有很大影響。但在圖分類任務建模的過程中,如何同時捕獲圖數據的特征信息,生成圖級表示,依舊是建模研究的核心問題。在以往的圖分類模型建模的過程中,要么集中在圖結構的拓撲結構信息建模上,要么集中在圖特征信息的建模上,很大程度上忽略了圖結構數據中各種信息的融合建模,從而無法獲得更好的圖的特征表示,影響了生物信息學分類的準確度。
發明內容
本發明要解決的技術問題,在于提供一種基于圖結構數據特征的生物信息學分類模型,為基于特征融合的圖神經網絡模型,可以同時捕獲圖的局部拓撲結構信息、全局拓撲結構信息以及長距離節點的依賴信息,將多種圖特征信息融合在一起,更好的生成整個圖的特征表示。
第一方面,本發明提供了一種基于圖結構數據特征的生物信息學分類模型,包括若干個逐級堆疊的特征提取層、若干個讀出層以及一個全連接層;任一所述特征提取層包括一圖卷積層和一圖池化層,所述圖卷積層通過所述圖池化層對應連接一所述讀出層,所述讀出層均連接所述全連接層;
所述圖池化層包括一個三通道池化模塊和一個特征融合模塊,所述三通道池化模塊包括圖卷積池化通道、微分池化通道和Transformer池化通道,分別用于學習圖結構數據的局部拓撲結構信息、全局拓撲結構信息以及節點間特征的依賴信息,所述特征融合模塊對所述局部拓撲結構信息、全局拓撲結構信息以及節點間特征的依賴信息進行融合,得到一池化圖;
前一級所述特征提取層所得的池化圖再輸入后一級所述特征提取層的圖卷積層,任一前級的所述特征提取層所得的池化圖由對應的所述讀出層提取圖特征表示后與最后一級所述特征提取層經由對應的所述讀出層提取的圖特征表示構成殘差連接,再由所述全連接層輸出生物信息學分類的預測結果。
本發明實施例中提供的一個或多個技術方案,至少具有如下技術效果或優點:提供一種基于圖結構數據特征的生物信息學分類模型,模型包括若干個逐級堆疊的特征提取層、若干個讀出層以及一個全連接層;任一所述特征提取層包括一圖卷積層和一圖池化層,其中每個圖池化層由一個三通道池化模塊以及一個特征融合模塊構成,三通道池化模塊包括圖卷積池化通道、微分池化通道和Transformer池化通道,分別用于學習圖結構數據的局部拓撲結構信息、全局拓撲結構信息以及節點間特征的依賴信息,從而使構建的模型在圖分類任務中具有較好性能表達,從而能更為準確地對圖結構數據特征的生物信息學進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建工程學院,未經福建工程學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310659097.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





