[發(fā)明專利]一種基于二維異質(zhì)網(wǎng)絡(luò)的代謝物-蛋白質(zhì)相互作用預測方法在審
| 申請?zhí)枺?/td> | 202011428394.2 | 申請日: | 2020-12-07 |
| 公開(公告)號: | CN114613428A | 公開(公告)日: | 2022-06-10 |
| 發(fā)明(設(shè)計)人: | 陳迪;樸海龍 | 申請(專利權(quán))人: | 中國科學院大連化學物理研究所 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B40/00 |
| 代理公司: | 沈陽科苑專利商標代理有限公司 21002 | 代理人: | 許宗富 |
| 地址: | 116023 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 二維 網(wǎng)絡(luò) 代謝物 蛋白質(zhì) 相互作用 預測 方法 | ||
本發(fā)明公開了一種基于二維異質(zhì)網(wǎng)絡(luò)的代謝物?蛋白質(zhì)相互作用預測方法,該方法包括:代謝物?蛋白質(zhì)二維異質(zhì)網(wǎng)絡(luò)構(gòu)建;代謝物?蛋白質(zhì)多維度相關(guān)性特征計算;基于隨機森林算法的代謝物?蛋白質(zhì)相互作用預測模型構(gòu)建;代謝物與蛋白質(zhì)相互作用預測的步驟。本發(fā)明基于建立的預測模型能夠可靠預測出潛在的代謝物?蛋白質(zhì)相互作用。
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息學領(lǐng)域,特別涉及利用計算機技術(shù)預測大分子-小分子間相互作用的領(lǐng)域。
背景技術(shù)
人體是一個復雜系統(tǒng),由基因、蛋白質(zhì)、代謝物等多類型、多層次的要素及各類要素間相互作用構(gòu)成,并通過復雜的相互作用、代償機制來維持系統(tǒng)的平衡和穩(wěn)態(tài)。對人體內(nèi)不同類型、不同層面復雜相互作用的深入探索有利于系統(tǒng)性刻畫生命體系,促進對癌癥等復雜疾病作用機制的理解與研究。
長久以來人們更加關(guān)注于DNA、蛋白質(zhì)等生物大分子的功能,而代謝物卻被認為是一種被動受到酶催化作用的終端產(chǎn)物,很少有研究關(guān)注到代謝物在其他生物學過程例如免疫、信號傳導方面的調(diào)控功能。最近,越來越多的研究發(fā)現(xiàn),代謝物通過與人體內(nèi)關(guān)鍵蛋白質(zhì)間的相互作用,同樣也參與調(diào)控和影響除了代謝以外的眾多生物學過程。因此,深入理解代謝物與蛋白質(zhì)間的相互作用具有重要意義。然而,目前已知的代謝物-蛋白質(zhì)相互作用主要局限于代謝酶及其反應物和產(chǎn)物間的相互作用,仍然有大量的代謝物-蛋白質(zhì)相互作用沒有得到揭示。
盡管高通量的質(zhì)譜技術(shù)已經(jīng)用于對特定代謝物相關(guān)作用蛋白質(zhì)的鑒定,然而此類方法的實驗成本高,并且通常受限于共價結(jié)合的相互作用方式。為了更加系統(tǒng)性、全面性地對代謝物-蛋白質(zhì)相互作用預測,本發(fā)明提出了一種基于二維異質(zhì)網(wǎng)絡(luò)的代謝物-蛋白質(zhì)相互作用預測方法,旨在通過計算方法對各類代謝物-蛋白質(zhì)相互作用進行高效的預測。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種基于二維異質(zhì)網(wǎng)絡(luò)的代謝物-蛋白質(zhì)相互作用預測方法,構(gòu)建代謝物與蛋白質(zhì)二維異質(zhì)生物網(wǎng)絡(luò),基于此網(wǎng)絡(luò)計算任意代謝物和蛋白質(zhì)間的多維度相關(guān)性,并構(gòu)建隨機森林分類模型,對潛在的代謝物與蛋白質(zhì)相互作用進行預測。
本發(fā)明解決其問題所采用的技術(shù)方案如下:
一種基于二維異質(zhì)網(wǎng)絡(luò)的代謝物-蛋白質(zhì)相互作用預測方法,該方法包括:
建模過程的步驟:基于二維異質(zhì)網(wǎng)絡(luò)構(gòu)建用于代謝物-蛋白質(zhì)相互作用預測的隨機森林模型;
步驟1:構(gòu)建代謝物-蛋白質(zhì)二維異質(zhì)網(wǎng)絡(luò);
步驟2:針對代謝物-蛋白質(zhì)相互作用,收集陰性、陽性樣本集和;
步驟3:對于陰性、陽性樣本集和中的任意一對樣本,計算每對代謝物-蛋白質(zhì)間的多維度相關(guān)性;
步驟4:結(jié)合多維度相關(guān)性計算結(jié)果,訓練基于隨機森林算法的代謝物-蛋白質(zhì)相互作用預測模型;
實際預測的步驟:基于上述構(gòu)建好的隨機森林模型預測任意一對代謝物與蛋白質(zhì)間是否具有相互作用;
針對代謝物-蛋白質(zhì)二維異質(zhì)網(wǎng)絡(luò)中任意一對沒有直接相連的代謝物和蛋白質(zhì),基于步驟3相同方法計算二者之間多維度相關(guān)性;將獲得的多維相關(guān)性帶入步驟4內(nèi)的預測模型,獲得這個代謝物與蛋白質(zhì)間具有相互作用的概率值,當概率值大于預設(shè)閾值,判斷該代謝物與蛋白質(zhì)具有相互作用。
所述構(gòu)建代謝物-蛋白質(zhì)二維異質(zhì)網(wǎng)絡(luò)包括如下三個步驟:
步驟11:構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò);
從BioGrid數(shù)據(jù)庫中讀取人類的蛋白質(zhì)-蛋白質(zhì)物理相互作用數(shù)據(jù),以基因名標記每一個蛋白質(zhì),并構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò);
步驟12:構(gòu)建代謝物-蛋白質(zhì)相互作用網(wǎng)絡(luò);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院大連化學物理研究所,未經(jīng)中國科學院大連化學物理研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011428394.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復網(wǎng)絡(luò)地址自動恢復的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





