[發明專利]基于深層圖卷積網絡的蛋白質-蛋白質相互作用位點預測方法有效
| 申請號: | 202110502536.3 | 申請日: | 2021-05-08 |
| 公開(公告)號: | CN113192559B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 楊躍東;袁乾沐;盧宇彤 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G16B25/00 | 分類號: | G16B25/00;G06N3/0464;G06N3/08 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深層 圖卷 網絡 蛋白質 相互作用 預測 方法 | ||
本發明公開了一種基于深層圖卷積網絡的蛋白質?蛋白質相互作用位點預測方法,包括步驟如下:根據蛋白質的序列和結構信息,提取節點特征矩陣和包含邊信息的鄰接矩陣,共同構成蛋白圖表征;采用基于初始殘差和恒等映射的深層圖卷積;深層圖卷積的最后一層圖卷積層的輸出輸入一個多層感知機,完成構建深層圖卷積神經網絡;將訓練數據提取得到蛋白圖表征,采用五折交叉驗證方法對深層圖卷積神經網絡進行訓練;將待測數據通過提取得到蛋白圖表征,并輸入訓練好的深層圖卷積神經網絡,實現對蛋白?蛋白相互作用位點的預測。本發明能更充分地利用蛋白質空間結構信息,進一步提高蛋白?蛋白相互作用位點預測的準確率。
技術領域
本發明涉及生物信息技術領域,更具體的,涉及一種基于深層圖卷積網絡的蛋白質-蛋白質相互作用位點預測方法。
背景技術
蛋白-蛋白相互作用(PPI)在信號傳導、物質運輸和新陳代謝等生理活動中扮演重要角色。識別蛋白-蛋白復合物之間參與物理接觸的氨基酸(即蛋白-蛋白相互作用位點)有助于構建蛋白-蛋白相互作用網絡、預測蛋白功能、揭示疾病機理和新藥研發。然而,用雙雜交試驗和親和力純化等傳統實驗方法來識別PPI位點成本高且耗時長。因此,研發能準確預測PPI位點的計算方法有很大的實際意義。
目前預測PPI位點的計算方法可根據方法所需的信息分為兩大類:
第一類是基于蛋白序列的方法,此類方法只需蛋白質的氨基酸序列信息即可做出預測,但它們的預測準確率通常非常有限;二類是基于蛋白結構的方法,此類方法需要蛋白質中氨基酸的三維原子坐標信息來預測PPI位點,而它們的預測準確率通常更高,且由于目前結構已知但功能未知的蛋白質越來越多,基于結構的預測方法有很大實際意義。
大多數現有的PPI位點預測方法基于機器學習技術,其中蛋白質會被編碼成特征矩陣。常用的蛋白特征包括獨熱(one-hot)編碼、進化保守性信息、二級結構、相對溶解性(RSA)和氨基酸物理化學性質等。提取蛋白質特征后,各種各樣的機器學習技術可被應用于PPI位點預測,如最近的基于序列的方法DELPHI使用了包含卷積神經網絡和循環神經網絡的集成框架;基于結構的方法DeepPPISP使用卷積神經網絡提取蛋白質全局信息。
然而,這些方法都只將蛋白質視作一維序列,從而去學習序列上相近的氨基酸的相互關系。由于蛋白質是一個折疊的三維結構,這些方法忽略了在序列上相距很遠,但在三維空間上相距很近的氨基酸帶來的影響。另一方面,基于結構的方法SPPIDER考慮到了這點,并利用帶權平均的方法整合空間上相距以內的氨基酸的特征。然而,這種選擇鄰居的方式基于一個較隨意的距離閾值,且不能提取到空間上相距較遠的氨基酸信息,而線性的平均也不能有效模擬空間相鄰的氨基酸之間的復雜關系。
發明內容
現有的PPI位點預測方法大多數只提取序列上相鄰的氨基酸信息,又或者是過于簡單地整合空間結構信息,為了解決現有方法的以上存在的不足,本發明提出了一種基于深層圖卷積網絡的蛋白質-蛋白質相互作用位點預測方法,其能更充分地利用蛋白質空間結構信息,進一步提高蛋白-蛋白相互作用位點預測的準確率。
為實現上述本發明目的,采用的技術方案如下:
一種基于深層圖卷積網絡的蛋白質-蛋白質相互作用位點預測方法,所述的方法包括步驟如下:
S1:根據蛋白質的序列和結構信息,提取節點特征矩陣和包含邊信息的鄰接矩陣,共同構成蛋白圖表征;
S2:采用基于初始殘差和恒等映射的深層圖卷積,以捕獲高階空間鄰近氨基酸的特征;并在深層圖卷積的最后一層圖卷積層的輸出輸入一個多層感知機,實現最終預測每一個氨基酸的蛋白相互作用概率,完成構建深層圖卷積神經網絡;
S3:將訓練數據通過步驟S1提取得到蛋白圖表征,采用五折交叉驗證方法對步驟S2得到的深層圖卷積神經網絡進行訓練;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110502536.3/2.html,轉載請聲明來源鉆瓜專利網。





