[發(fā)明專利]一種蛋白質(zhì)異構(gòu)體對相互作用預(yù)測方法及裝置有效
| 申請?zhí)枺?/td> | 202010157694.5 | 申請日: | 2020-03-09 |
| 公開(公告)號: | CN111370068B | 公開(公告)日: | 2022-11-04 |
| 發(fā)明(設(shè)計)人: | 王建新;文驥威;李洪東 | 申請(專利權(quán))人: | 中南大學(xué) |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B20/00 |
| 代理公司: | 長沙市融智專利事務(wù)所(普通合伙) 43114 | 代理人: | 楊萍 |
| 地址: | 410083 湖南*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 蛋白質(zhì) 異構(gòu)體 相互作用 預(yù)測 方法 裝置 | ||
本發(fā)明公開了一種蛋白質(zhì)異構(gòu)體對相互作用預(yù)測方法及裝置,所述方法包括以下步驟,首先對于每個蛋白質(zhì)異構(gòu)體對,基于其在n個組織中的表達(dá)數(shù)據(jù)的皮爾遜相關(guān)系數(shù)分別確定其n個特征;然后獲取蛋白質(zhì)相互作用數(shù)據(jù),其中包括具有相互作用的蛋白質(zhì)對,對于這些蛋白質(zhì)對,篩選出僅對應(yīng)一個蛋白質(zhì)異構(gòu)體對的蛋白質(zhì)對,令其對應(yīng)的蛋白質(zhì)異構(gòu)體對的標(biāo)簽為1;利用隨機采樣方法產(chǎn)生不具有相互作用的蛋白質(zhì)對,令其對應(yīng)的所有蛋白質(zhì)異構(gòu)體對的標(biāo)簽為0;將確定了標(biāo)簽的蛋白質(zhì)異構(gòu)體對作為樣本,基于樣本數(shù)據(jù)訓(xùn)練預(yù)測模型;最后對于待分類的蛋白質(zhì)異構(gòu)體對,將其特征數(shù)據(jù)輸入訓(xùn)練好的預(yù)測模型,得到其預(yù)測結(jié)果。本發(fā)明能夠較準(zhǔn)確的預(yù)測蛋白質(zhì)相互作用關(guān)系。
技術(shù)領(lǐng)域
本發(fā)明屬于生物信息學(xué),涉及一種蛋白質(zhì)異構(gòu)體對相互作用預(yù)測方法及裝置。
背景技術(shù)
蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)是指兩個或多個蛋白質(zhì)分子通過非共價鍵形成蛋白質(zhì)復(fù)合物的過程。PPI是細(xì)胞生命活動的基礎(chǔ),在生物體中,有一些蛋白質(zhì)可以以單體的形式發(fā)揮作用,但是大部分的蛋白質(zhì)都是和伴侶分子或是與其他蛋白質(zhì)一起發(fā)揮作用的。并且蛋白質(zhì)與蛋白質(zhì)之間相互作用構(gòu)成了細(xì)胞生化反應(yīng)網(wǎng)絡(luò)的一個主要組成部分,蛋白-蛋白互作網(wǎng)絡(luò)與轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)對調(diào)控細(xì)胞及其信號有重要意義。
由于可變剪切過程的存在,一個基因會編碼多種蛋白質(zhì)異構(gòu)體(proteinisoform),一個蛋白質(zhì)可能存在多個蛋白質(zhì)異構(gòu)體,相應(yīng)的一個蛋白質(zhì)對可能對應(yīng)多個蛋白質(zhì)異構(gòu)體對。例如蛋白質(zhì)A存在3種異構(gòu)體,蛋白質(zhì)B存在2種異構(gòu)體,通過排列組合,那這兩個蛋白質(zhì)之間實際可能有6種異構(gòu)體之間的相互作用。簡而言之,兩個蛋白質(zhì)相互作用的關(guān)系在異構(gòu)體水平上可能存在多種相互作用關(guān)系。正是因為可變剪切導(dǎo)致蛋白質(zhì)異構(gòu)體的多樣性,這使得蛋白質(zhì)相互作用的研究內(nèi)容變得十分復(fù)雜且具有挑戰(zhàn)性。目前的蛋白質(zhì)相互作用數(shù)據(jù)未對異構(gòu)體進行區(qū)分。
目前蛋白質(zhì)異構(gòu)體對相互作用研究仍處于初步研究階段,相關(guān)研究比較缺乏,進展緩慢。
目前在蛋白質(zhì)異構(gòu)體對相互作用預(yù)測方面主要有二大類別的方法:
(1)通過生物實驗方法進行檢測:
這種傳統(tǒng)的生物實驗方法預(yù)測的結(jié)果是有一定程度的精確性的。已經(jīng)報導(dǎo)的實驗方法首先通過將同一基因的不同mRNA剪接異構(gòu)體克隆出來,然后再翻譯成為不同的蛋白質(zhì)異構(gòu)體,最后采用酵母菌雙雜交發(fā)測定蛋白質(zhì)異構(gòu)體之間的相互作用。此類實驗方法需要大量人力和實驗資源,同時還需要花費大量時間,而且僅僅能對少量的蛋白質(zhì)異構(gòu)體之間的相互作用進行預(yù)測。到目前為止,最全面的實驗僅僅獲得了來自于100多個基因的蛋白質(zhì)異構(gòu)體的相互作用數(shù)據(jù)。
(2)通過機器學(xué)習(xí)的方法進行預(yù)測:
在已發(fā)表的文獻《IIIDB:a database for isoform-isoform interactions andisoform network modules》中,研究人員利用蛋白質(zhì)異構(gòu)體對應(yīng)的RNA-sq數(shù)據(jù)、蛋白質(zhì)異構(gòu)體的表達(dá)數(shù)據(jù)作為特征,結(jié)合蛋白質(zhì)域相互作用數(shù)據(jù),采用邏輯回歸模型(LR)構(gòu)建蛋白質(zhì)異構(gòu)體對相互作用預(yù)測模型,對蛋白質(zhì)異構(gòu)體之間的相互作用進行預(yù)測。相比于實驗方法,此方法能夠大量節(jié)省人力和實驗資源,并能對所有可能的蛋白質(zhì)異構(gòu)體之間的相互作用進行預(yù)測。此方法的局限在于模型未能充分利用所有蛋白質(zhì)異構(gòu)體的信息,而且邏輯回歸模型難以捕獲蛋白質(zhì)異構(gòu)體表達(dá)水平與蛋白質(zhì)異構(gòu)體對相互作用之間的非線性關(guān)系,預(yù)測準(zhǔn)確性有待進一步提高。
因此,非常有必要提出新的方案對蛋白質(zhì)異構(gòu)體間的相互作用進行預(yù)測。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是,針對現(xiàn)有技術(shù)的不足,提供一種蛋白質(zhì)異構(gòu)體對相互作用預(yù)測方法及裝置,能夠較準(zhǔn)確地預(yù)測蛋白質(zhì)異構(gòu)體對相互作用,有效避免生物化學(xué)實驗所消耗的大量人力物力。
發(fā)明所提供的技術(shù)方案如下:
一方面,提供一種蛋白質(zhì)異構(gòu)體對相互作用預(yù)測方法,包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南大學(xué),未經(jīng)中南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010157694.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





