[發(fā)明專利]基于網(wǎng)絡(luò)傳播的蛋白質(zhì)功能預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201911369728.0 | 申請(qǐng)日: | 2019-12-26 |
| 公開(公告)號(hào): | CN111145830A | 公開(公告)日: | 2020-05-12 |
| 發(fā)明(設(shè)計(jì))人: | 胡賽;趙碧海;熊慧軍;王皓鋆 | 申請(qǐng)(專利權(quán))人: | 長(zhǎng)沙學(xué)院 |
| 主分類號(hào): | G16B20/00 | 分類號(hào): | G16B20/00;G16B40/00 |
| 代理公司: | 安化縣梅山專利事務(wù)所 43005 | 代理人: | 潘訪華 |
| 地址: | 410022 湖*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 網(wǎng)絡(luò) 傳播 蛋白質(zhì) 功能 預(yù)測(cè) 方法 | ||
本發(fā)明公開了一種基于網(wǎng)絡(luò)傳播的蛋白質(zhì)功能預(yù)測(cè)方法,包括以下步驟:根據(jù)蛋白質(zhì)相互作用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)建立無(wú)向加權(quán)網(wǎng)絡(luò),并將無(wú)向加權(quán)網(wǎng)絡(luò)表征為無(wú)向圖鄰接矩陣M;根據(jù)蛋白質(zhì)結(jié)構(gòu)域信息和蛋白質(zhì)復(fù)合物信息計(jì)算得到初始傳播距離矩陣MI;根據(jù)無(wú)向圖鄰接矩陣M和初始傳播距離矩陣MI,迭代地計(jì)算蛋白質(zhì)間的網(wǎng)絡(luò)傳播距離以得到網(wǎng)絡(luò)傳播矩陣MP;根據(jù)網(wǎng)絡(luò)傳播矩陣MP逐步添加與測(cè)試蛋白質(zhì)的鄰接節(jié)點(diǎn)構(gòu)成功能模塊,多個(gè)功能模塊構(gòu)成候選功能列表;對(duì)候選功能列表中的候選功能評(píng)分、排序,選擇排名靠前的若干項(xiàng)功能注釋測(cè)試蛋白質(zhì)。本發(fā)明改進(jìn)了蛋白質(zhì)功能預(yù)測(cè)方法研究中多源生物數(shù)據(jù)的融合方式,降低了相互作用網(wǎng)絡(luò)中假陽(yáng)性和假陰性對(duì)預(yù)測(cè)造成的負(fù)面影響,大大提高了蛋白質(zhì)功能預(yù)測(cè)的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及蛋白質(zhì)功能預(yù)測(cè)技術(shù)領(lǐng)域,具體涉及一種基于網(wǎng)絡(luò)傳播的蛋白質(zhì)功能預(yù)測(cè)方法。
背景技術(shù)
蛋白質(zhì)功能的準(zhǔn)確注釋是從分子水平理解生命的關(guān)鍵,對(duì)生物醫(yī)學(xué)和制藥產(chǎn)生巨大的影響。隨著很多物種基因組測(cè)序工作的完成,序列數(shù)據(jù)與他們功能注釋之間的差異日益增大。UniProt數(shù)據(jù)庫(kù)中有功能注釋的序列數(shù)據(jù)不足14%,序列數(shù)據(jù)還在成倍增長(zhǎng)。早期預(yù)測(cè)蛋白質(zhì)功能都是基于實(shí)驗(yàn)方法,如基因敲除,有針對(duì)性的突變與基因表達(dá)的抑制等。這些實(shí)驗(yàn)方法需要付出大量的實(shí)驗(yàn)成本和人力成本,也不適合注釋蛋白質(zhì)的重要部分,從而使得序列與功能之間的差距日益擴(kuò)大。因此,提出高效的蛋白質(zhì)功能注釋的計(jì)算方法成為人們關(guān)注的熱點(diǎn)問(wèn)題之一。
目前蛋白質(zhì)功能預(yù)測(cè)的計(jì)算方法大致可以分為基于序列結(jié)構(gòu)的方法、基于網(wǎng)絡(luò)的方法和多元生物信息融合的方法三種。
(1)基于序列結(jié)構(gòu)的方法
早期的計(jì)算方法大都基于蛋白質(zhì)氨基酸序列相似性或編碼基因融合原理以及蛋白質(zhì)系統(tǒng)發(fā)生譜研究。Henning等首先將GO注釋應(yīng)用于他們的GOblet的BLAST搜索結(jié)果,Groth只是簡(jiǎn)單地將序列匹配到有向無(wú)環(huán)圖表示的GO。雖然沒有結(jié)合相似分?jǐn)?shù),用戶可以直觀地了解有多少個(gè)序列匹配到共同的GO條目。Zehetner通過(guò)加權(quán)檢索的GO條目列表,將這種匹配擴(kuò)展到OntoBlast方法。Khan等提出的GOFigure方法和Martin等提出的GOtcha方法采用了相似的加權(quán)方式或排名方案,但是所有的分值從GO條目傳播到GO DAG中的父條目層次。任何預(yù)測(cè)GO條目的最后分?jǐn)?shù)根據(jù)各自的貢獻(xiàn)被歸一化。Stavros等使用SSP(序列相似性概要)將蛋白質(zhì)與一組帶注釋的訓(xùn)練蛋白質(zhì)進(jìn)行比較,提出了兩種新的LSDR方法,一種是基于GO結(jié)構(gòu)的LSDR方法,另一種是基于術(shù)語(yǔ)語(yǔ)義相似性的LSDR方法。
(2)基于網(wǎng)絡(luò)的方法
通過(guò)分析蛋白質(zhì)間的相互作用,利用已有的蛋白質(zhì)功能信息,根據(jù)未知蛋白質(zhì)與已知蛋白質(zhì)間的關(guān)聯(lián)性來(lái)注釋未知的蛋白質(zhì)。Schwikowski等提出NC(neighbor counting)方法,將在鄰居蛋白質(zhì)中出現(xiàn)次數(shù)最多的功能預(yù)測(cè)為蛋白質(zhì)的功能。Hishigaki等利用卡方統(tǒng)計(jì)量對(duì)待測(cè)蛋白質(zhì)的近鄰蛋白質(zhì)中功能出現(xiàn)的次數(shù)進(jìn)行評(píng)估,用期望出現(xiàn)的次數(shù)和實(shí)際出現(xiàn)的次數(shù)的差異來(lái)預(yù)測(cè)蛋白質(zhì)是否具有某一功能。Chua等調(diào)查分析功能相似性與網(wǎng)絡(luò)距離的聯(lián)系,他們關(guān)注蛋白質(zhì)的一級(jí)和二級(jí)鄰居,設(shè)計(jì)了一種功能相似性計(jì)算方法,根據(jù)與目標(biāo)蛋白質(zhì)的距離為不同的蛋白質(zhì)賦予不同的權(quán)值。
Vazquez等為每一個(gè)未注釋的蛋白質(zhì)賦予一個(gè)功能,使得連接相同功能蛋白質(zhì)(未注釋或已注釋)的邊數(shù)量最大。Karaoz等采用一種局部搜索程序輪流地搜索每一個(gè)節(jié)點(diǎn),直至全部覆蓋。節(jié)點(diǎn)的狀態(tài)將根據(jù)大部分鄰居的狀態(tài)而改變,這個(gè)過(guò)程保證至少一半得到最優(yōu)。Sun等也使用了類似的方法,只是他們使用了不同的目標(biāo)函數(shù)和求解方法。Brun等提出基于蛋白質(zhì)距離的PRODISTIN算法,采用BioNJ算法產(chǎn)生層次化的功能樹,并進(jìn)一步創(chuàng)建了在線的功能注釋工具。類似的,Samanta等采用超幾何分布計(jì)算P-value值來(lái)度量蛋白質(zhì)間的距離,而預(yù)測(cè)功能時(shí)則仍采用多數(shù)表決的方法。Nabieva等提出一種相關(guān)的方法,將功能注釋問(wèn)題描述為一個(gè)多路切割問(wèn)題。
(3)多元生物信息融合的方法
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于長(zhǎng)沙學(xué)院,未經(jīng)長(zhǎng)沙學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911369728.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





