[發明專利]基于殘差注意力的多通路的蛋白質與蛋白質作用位點預測方法、設備和介質在審
| 申請號: | 202310097311.3 | 申請日: | 2023-02-10 |
| 公開(公告)號: | CN116206679A | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 李敏;張富豪 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B40/00;G06N3/0464;G06N3/08 |
| 代理公司: | 長沙市融智專利事務所(普通合伙) 43114 | 代理人: | 熊開蘭 |
| 地址: | 410083 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 注意力 通路 蛋白質 作用 預測 方法 設備 介質 | ||
本發明公開了一種基于殘差注意力的多通路的蛋白質與蛋白質作用位點預測方法、設備和介質,方法包括:基于蛋白質序列提取蛋白質的生物理化特性;使用兩個不同的通路模塊,分別根據生物理化特性預測蛋白質的相互作用位點;其中,兩個通路模塊均基于殘差注意力從特征理化特性中提取隱特征向量,以及采用多層感知機根據隱特征向量預測相互作用位點,且第一通路模塊使用穩定結構蛋白質樣本訓練得到,第二通路模塊使用無序蛋白質樣本訓練得到;根據兩個通路模塊得到的相互作用位點預測結果,以及蛋白質無序傾向性,最終確定蛋白質的相互作用位點。本方法預測效果好、適用性強,且具有較強泛化能力。
技術領域
本發明涉及生物信息學領域,具體涉基于殘差注意力的多通路的蛋白質與蛋白質作用位點預測方法、設備和介質。
背景技術
蛋白質與蛋白質的相互作用(PPI)對許多細胞功能至關重要,包括對細胞周期、信號傳導和代謝的調節。對PPI的了解促進了對細胞過程的理解、蛋白質對接的發展和應用、PPI網絡的發展、藥物設計工作以及對某些疾病背后的分子機制的探索。有關PPI的信息可以在多個數據庫中找到,包括提供原子級細節的蛋白質數據庫(PDB)和BioLiP側重于氨基酸水平的注釋,以及STRING、mentha和BioGRID在蛋白質水平注釋這些相互作用。雖然數十億的相互作用已經在蛋白質水平上進行了注釋,但只有一小部分的相互作用殘基有更詳細的注釋。
這一巨大的知識差距促使人們開發了幾十種預測蛋白質序列中蛋白質結合殘基(PBRs)的計算方法。最近的工作將這些方法分為兩大類:使用結構化蛋白質-蛋白質復合物的訓練數據集開發的方法與使用內在無序的PBRs注釋開發的方法。最近的工作表明,基于結構蛋白質訓練和無序蛋白質訓練的預測器對另外一種類型蛋白質的相互作用預測結果偏差,即結構訓練的預測器對無序PBRs的預測表現很差,反之亦然。
發明內容
針對目前蛋白質與蛋白質相互作用位點預測方法在結構蛋白質和無序蛋白質上泛化性能差問題,本發明提供一種基于殘差注意力的多通路的蛋白質與蛋白質作用位點預測方法、設備和介質,可以在結構蛋白質和無序蛋白質上都取得準確的預測結果。
為實現上述技術目的,本發明采用如下技術方案:
一種基于殘差注意力的多通路的蛋白質與蛋白質作用位點預測方法,包括:
基于蛋白質序列提取蛋白質的生物理化特性;
使用兩個不同的通路模塊,分別根據生物理化特性預測蛋白質的相互作用位點;其中,兩個通路模塊均基于殘差注意力從特征理化特性中提取隱特征向量,以及采用多層感知機根據隱特征向量預測相互作用位點,且第一通路模塊使用穩定結構蛋白質樣本訓練得到,第二通路模塊使用無序蛋白質樣本訓練得到;
根據兩個通路模塊得到的相互作用位點預測結果,以及蛋白質無序傾向性,最終確定蛋白質的相互作用位點。
進一步地,所述生物理化特性包括蛋白質的序列特征E1、數值特征E2、蛋白質水平的集合特征E3和窗口水平的集合特征E4;
所述序列特征E1包括各氨基酸的溶劑可及性、保守性、無序傾向性、無序區結合傾向性、結合傾向性以及蛋白質的二級結構信息;
所述數值特征E2,通過對蛋白質序列中各氨基酸進行one-hot編碼得到;
所述蛋白質水平的集合特征E3,通過對每種序列特征取所有氨基酸的平均值得到;
所述窗口水平的集合特征E4,通過對蛋白質序列設置滑動窗口,再取滑動窗口內中間區域序列特征均值與兩側翼區域序列特征均值的差值,所有滑動窗口所得值作為窗口水平的集合特征。
進一步地,第一通路模塊根據生物理化特性預測蛋白質的相互作用位點,具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310097311.3/2.html,轉載請聲明來源鉆瓜專利網。





