[發明專利]一種基于多通道圖卷積神經網絡的蛋白質互作網絡節點分類方法在審
| 申請號: | 202011260336.3 | 申請日: | 2020-11-12 |
| 公開(公告)號: | CN112364983A | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 楊旭華;馬鋼峰;徐新黎 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G16B15/20;G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 通道 圖卷 神經網絡 蛋白質 網絡 節點 分類 方法 | ||
一種基于多通道圖卷積神經網絡的蛋白質互作網絡節點分類方法,通過組合高階信息來提高分類效果,根據蛋白質相互作用數據構建一個蛋白質互作網絡,構建多通道圖卷積神經網絡模型,該模型包含兩層結構,使用不同的圖卷積核組合,在少數有標簽蛋白質的數據基礎上完成半監督分類,得到無標簽蛋白質的類別。本發明通過多通道的高階鄰域圖卷積神經網絡組合來提取蛋白質互作網絡的高階信息,在較低的運算代價下提升了對蛋白質的分類精度。
技術領域
本發明涉及蛋白質分類領域,特別是指一種基于多通道圖卷積神經網絡的蛋白質互作網絡節點分類方法。
背景技術
蛋白質是生命的物質基礎,人體幾乎所有的組成部分都離不開蛋白質,長期以來都是研究的熱點。蛋白質往往通過相互作用來參與細胞代謝、基因表達調節等等生命過程,以此基礎上形成了蛋白質互作網絡。蛋白質互作網絡通過網絡來形象化描述蛋白質之間存在的關系,有助于研究分析,對于從分子層面了解生物組成和一些疾病原因起到十分重要的作用。
圖卷積網絡旨在對非規則復雜網絡數據進行卷積分析。在半監督學習中,圖卷積能夠通過極少的有標簽訓練集得到較好的分類性能,且訓練速度較快,被廣泛應用于各類網絡結構數據集。然而,高階的鄰域信息聚合會造成特征過平滑,因此,普通的圖卷積網絡往往只能聚集2~3階鄰域特征信息,但蛋白質互作網絡中的蛋白質之間聯系相對緊密,只聚合低階信息是不夠的。同時,蛋白質互作網絡數據往往比較龐大且復雜,因此,在控制網絡深度,即在較少參數下,捕捉高階鄰域信息,得到更好的蛋白質分類性能,就顯得非常的必要。
發明內容
為了克服現有蛋白質互作網絡分類結果偏差較大的問題,本發明提出一種準確性較高的一種基于多通道圖卷積神經網絡的蛋白質互作網絡節點分類方法。
本發明解決其技術問題所采用的技術具體步驟是:
一種基于多通道圖卷積神經網絡的蛋白質互作網絡節點分類方法,包括如下步驟:
步驟一:根據蛋白質相互作用數據構建一個蛋白質互作網絡模型G(V,E),V為節點,E為連邊,鄰接矩陣用A表示,其中,一個節點表示一個蛋白質,節點集V={v1,v2,...,vN}表示蛋白質集合;如果兩個蛋白質存在相互作用,則相應的兩個節點之間有連邊;N表示蛋白質數量,每個蛋白質初始特征向量都用one-hot向量表示,單位矩陣X為所有蛋白質初始特征向量的組合,C為蛋白質的類別數,已知少部分蛋白質有類別標簽,大部分蛋白質沒有類別標簽;
步驟二:構建多通道圖卷積神經網絡模型,該模型包含兩層結構,第一層有k條通道,其中第i條通道上使用i階卷積核SGCi,i∈{1,2,...,k};第二層包含k個三維卷積核,其中第j條通道上使用(k+1-j)階卷積核SGCk+1-j,j∈{1,2,...,k},網絡模型的第i通道由第一層的第i通道和第二層的第i通道組成,其中第一層的第i通道的輸出為第二層第i通道的輸入;
步驟三:計算i階卷積核
其中GCN表示不含激活函數的圖卷積神經網絡,其中1≤i≤k;
步驟四:計算多通道圖卷積神經網絡模型的第i通道的輸出
y(i)=SGC(k+1-i)(f(SGCi(X,A)),A),
其中,1≤i≤k,f為relu函數;
步驟五:計算多通道圖卷積神經網絡模型的模型輸出
其中,g為softmax激活函數;
步驟六:計算半監督分類的損失值
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011260336.3/2.html,轉載請聲明來源鉆瓜專利網。





