[發明專利]一種基于二維異質網絡的代謝物-蛋白質相互作用預測方法在審
| 申請號: | 202011428394.2 | 申請日: | 2020-12-07 |
| 公開(公告)號: | CN114613428A | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 陳迪;樸海龍 | 申請(專利權)人: | 中國科學院大連化學物理研究所 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B40/00 |
| 代理公司: | 沈陽科苑專利商標代理有限公司 21002 | 代理人: | 許宗富 |
| 地址: | 116023 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 二維 網絡 代謝物 蛋白質 相互作用 預測 方法 | ||
1.一種基于二維異質網絡的代謝物-蛋白質相互作用預測方法,其特征在于:該方法包括:
建模過程的步驟:基于二維異質網絡構建用于代謝物-蛋白質相互作用預測的隨機森林模型;
步驟1:構建代謝物-蛋白質二維異質網絡;
步驟2:針對代謝物-蛋白質相互作用,收集陰性、陽性樣本集和;
步驟3:對于陰性、陽性樣本集和中的任意一對樣本,計算每對代謝物-蛋白質間的多維度相關性;
步驟4:結合多維度相關性計算結果,訓練基于隨機森林算法的代謝物-蛋白質相互作用預測模型;
實際預測的步驟:基于上述構建好的隨機森林模型預測任意一對代謝物與蛋白質間是否具有相互作用;
針對代謝物-蛋白質二維異質網絡中任意一對沒有直接相連的代謝物和蛋白質,基于步驟3相同方法計算二者之間多維度相關性;將獲得的多維相關性帶入步驟4內的預測模型,獲得這個代謝物與蛋白質間具有相互作用的概率值,當概率值大于預設閾值,判斷該代謝物與蛋白質具有相互作用。
2.如權利要求1所述的預測方法,其特征在于:
所述構建代謝物-蛋白質二維異質網絡包括如下三個步驟:
步驟11:構建蛋白質-蛋白質相互作用網絡;
從BioGrid數據庫中讀取人類的蛋白質-蛋白質物理相互作用數據,以基因名標記每一個蛋白質,并構建蛋白質-蛋白質相互作用網絡;
步驟12:構建代謝物-蛋白質相互作用網絡;
通過從KEGG數據庫讀取人類代謝通路的KGML文件,獲取反應式信息;獲取每個反應式中的酶、反應物、產物,并且以基因名標記酶,以KEGG的化合物ID標記反應物、產物;
標記相互作用關系用于表示處于作用關系兩端的參與到同一個反應中的任意一個酶與一個反應物,或者任意一個酶與任意一個產物間存在相互作用,整合所有反應中非重復的相互作用,構建代謝物-蛋白質相互作用網絡;
步驟13:構建代謝物-代謝物相互作用網絡;
從PubChem數據庫讀取KEGG代謝通路中每個代謝物的sdf二維結構文件;分別計算每個代謝物的分子描述符;計算任意兩個代謝物的分子描述符間的Tanimoto相關系數;
利用所有相關性大于0的代謝物-代謝物關聯構建代謝物-代謝物相互作用網絡。
3.如權利要求1所述的預測方法,其特征在于,所述步驟2中樣本收集包括以下步驟:
步驟21:以所述步驟12中代謝物-蛋白質相互作用網絡中刪除鄰居節點個數排名前10的代謝物后,剩余所有具有相互作用的成對的代謝物及蛋白質作為陽性樣本集合;
步驟22:對陽性集合中所有的代謝物和蛋白質進行隨機配對,并保證不與陽性集合重復,隨機地生成與陽性集合數量一致的陰性集合。
4.如權利要求1所述的預測方法,其特征在于,所述步驟3多維度相關性計算包括以下步驟:
步驟31:根據蛋白質-蛋白質相互作用構建蛋白質鄰接矩陣P;
步驟32:根據代謝物-蛋白質相互作用構建代謝物-蛋白質鄰接矩陣I;
步驟33:根據代謝物-蛋白質相互作用構建代謝物-代謝物鄰接矩陣M;
步驟34:基于鄰接矩陣P、I、M計算4維度的代謝物-蛋白質相關性。
5.如權利要求4所述的預測方法,其特征在于,所述步驟31中蛋白質鄰接矩陣P滿足如下條件:
其中,Pi,j表示矩陣P中的第i行、第j列內數值。
6.如權利要求4所述的預測方法,其特征在于,所述步驟32中代謝物-蛋白質鄰接矩陣I滿足如下條件:
其中,Ii,j表示矩陣I中的第i行、第j列內數值。
7.如權利要求4所述的預測方法,其特征在于,所述步驟33中代謝物鄰接矩陣M滿足如下條件:
Mi,j=代謝物i與代謝物j分子描述符間Tanimoto相關系數
其中,Mi,j表示矩陣M中的第i行、第j列內數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院大連化學物理研究所,未經中國科學院大連化學物理研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011428394.2/1.html,轉載請聲明來源鉆瓜專利網。





