[發(fā)明專利]采用改進(jìn)花授粉算法識別關(guān)鍵蛋白質(zhì)的方法有效
| 申請?zhí)枺?/td> | 201711039345.8 | 申請日: | 2017-10-30 |
| 公開(公告)號: | CN107885971B | 公開(公告)日: | 2021-01-15 |
| 發(fā)明(設(shè)計)人: | 雷秀娟;方銘;代才 | 申請(專利權(quán))人: | 陜西師范大學(xué) |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20;G16B25/10;G16B5/00 |
| 代理公司: | 西安通大專利代理有限責(zé)任公司 61200 | 代理人: | 強(qiáng)宏超 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 采用 改進(jìn) 授粉 算法 識別 關(guān)鍵 蛋白質(zhì) 方法 | ||
本發(fā)明公開了一種采用改進(jìn)花授粉算法識別關(guān)鍵蛋白質(zhì)的方法,將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化為無向圖、選取度最大的前Q個蛋白質(zhì)作為花粉個體、度量PeC中心性、確定復(fù)合物信息、確定亞細(xì)胞定位信息,評價花粉重要性、更新花粉位置、輸出識別的關(guān)鍵蛋白質(zhì);本發(fā)明在評價花粉重要性時不僅考慮了蛋白質(zhì)網(wǎng)絡(luò)的拓?fù)鋵傩裕胰诤狭说鞍踪|(zhì)網(wǎng)絡(luò)的生物特性,能準(zhǔn)確地識別關(guān)鍵蛋白;仿真實驗結(jié)果表明,正確率、特異性、敏感度等指標(biāo)性能較優(yōu);與其他關(guān)鍵蛋白識別方法相比,結(jié)合蛋白質(zhì)網(wǎng)絡(luò)的拓?fù)鋵傩院蜕锾匦裕瑢崿F(xiàn)關(guān)鍵蛋白質(zhì)識別過程,提高了關(guān)鍵蛋白的識別準(zhǔn)確率。
【技術(shù)領(lǐng)域】
本發(fā)明屬于生物信息領(lǐng)域,涉及一種蛋白質(zhì)相互作用網(wǎng)絡(luò)中關(guān)鍵蛋白質(zhì)的識別方法,具體涉及一種采用改進(jìn)花授粉算法識別關(guān)鍵蛋白質(zhì)的方法。
【背景技術(shù)】
關(guān)鍵蛋白質(zhì)是細(xì)胞生命活動中所必需的蛋白質(zhì),關(guān)鍵蛋白質(zhì)的缺失會導(dǎo)致有關(guān)蛋白質(zhì)復(fù)合物功能喪失,并導(dǎo)致生物體無法生存。由于關(guān)鍵蛋白質(zhì)在生命活動中扮演重要角色,因此對于關(guān)鍵蛋白質(zhì)的預(yù)測與識別成為一項重要研究工作,識別關(guān)鍵蛋白質(zhì)對于研究細(xì)胞的生長調(diào)控過程具有重要意義。此外,在生物醫(yī)學(xué)領(lǐng)域,關(guān)鍵蛋白質(zhì)的識別對于致病基因的發(fā)現(xiàn)及藥物標(biāo)靶的鑒定具有重要意義,在疾病診治和藥物設(shè)計等方面具有重要的應(yīng)用價值。
在生物學(xué)領(lǐng)域,一般利用基因敲除,RNA干擾等實驗方法,例如單基因挑出和條件性基因剔除等,通過觀察生物體的生存情況來辨別蛋白質(zhì)的關(guān)鍵性,通過這些實驗技術(shù)得到的結(jié)果雖然準(zhǔn)確有效,但是代價高、效率低,并且適用的物種范圍有限。近年來,隨著酵母雙雜交,串聯(lián)親和純化和質(zhì)譜分析等高通量的蛋白質(zhì)組技術(shù)的發(fā)展,大量的蛋白質(zhì)相互作用數(shù)據(jù)被檢測出來,使得在網(wǎng)絡(luò)水平上預(yù)測關(guān)鍵蛋白質(zhì)成為可能,通過計算生物學(xué)的方法來預(yù)測關(guān)鍵蛋白質(zhì)成為一個新的發(fā)展方向。
已有研究表明,蛋白質(zhì)的關(guān)鍵性與它在生物網(wǎng)絡(luò)中所對應(yīng)結(jié)點(diǎn)的拓?fù)涮匦悦芮邢嚓P(guān),因此,出現(xiàn)了一系列利用結(jié)點(diǎn)的中心性測度識別關(guān)鍵蛋白質(zhì)的方法。結(jié)點(diǎn)的中心性測度通常用來衡量結(jié)點(diǎn)在網(wǎng)絡(luò)中影響力的大小,評估結(jié)點(diǎn)所代表的對象獲得、控制信息及資源的能力。基于結(jié)點(diǎn)中心性的關(guān)鍵蛋白質(zhì)預(yù)測,主要是通過計算蛋白質(zhì)網(wǎng)路中各蛋白質(zhì)結(jié)點(diǎn)的中心性測度,按中心性測度值由大到小的順序篩選出一定數(shù)量的蛋白質(zhì)作為預(yù)測的關(guān)鍵蛋白質(zhì)集合。
度中心性(degree centrality,DC)是最常用的一種中心性測度,一個結(jié)點(diǎn)的度中心性表示為與該結(jié)點(diǎn)直接相連的鄰居結(jié)點(diǎn)的個數(shù)。Jeong等提出“中心性-致死性”法則(centrality-lethality rule),該法則顯示一個蛋白質(zhì)參與的相互作用越多,則它對細(xì)胞的生存也就越重要。除了度中心性以外,還有介數(shù)中心性、接近度中心性、子圖中心性、特征向量中心性、信息中心性、局部平均聯(lián)通性和邊聚集系數(shù)之和。其中,結(jié)點(diǎn)的介數(shù)中心性(betweenness centrality,BC)表示網(wǎng)絡(luò)中所有最短路徑中經(jīng)過該結(jié)點(diǎn)的數(shù)目占所有最短路徑數(shù)的比例;結(jié)點(diǎn)的接近度中心性(closeness centrality,CC)為反比于該結(jié)點(diǎn)到網(wǎng)絡(luò)中其他所有結(jié)點(diǎn)的最短路徑之和;結(jié)點(diǎn)的子圖中心性(subgraph centrality,SC)是該結(jié)點(diǎn)參與網(wǎng)絡(luò)閉合回路的總數(shù);結(jié)點(diǎn)的特征向量中心性(eigenvector centrality,EC)被定義為網(wǎng)絡(luò)鄰接矩陣的主特征向量該結(jié)點(diǎn)的分量;結(jié)點(diǎn)的信息中心性(informationcentrality,IC)是測量以該結(jié)點(diǎn)為端點(diǎn)的路徑的調(diào)和平均長度;結(jié)點(diǎn)的局部平均聯(lián)通性(local average connectivity,LAC)是指該結(jié)點(diǎn)的鄰居結(jié)點(diǎn)彼此之間公共鄰居結(jié)點(diǎn)的個數(shù)之和除以該結(jié)點(diǎn)的鄰居結(jié)點(diǎn)的個數(shù);結(jié)點(diǎn)的邊聚集系數(shù)之和(sum of edge clusteringcoefficient,NC)是指該結(jié)點(diǎn)所有連接邊的聚集系數(shù)之和。這8種中心性測度都已被用于生物網(wǎng)絡(luò)中關(guān)鍵蛋白質(zhì)的預(yù)測,且發(fā)現(xiàn)任何一個中心性測度的預(yù)測結(jié)果都遠(yuǎn)遠(yuǎn)好于隨機(jī)選擇的結(jié)果,從而證明蛋白質(zhì)的關(guān)鍵性與其對應(yīng)結(jié)點(diǎn)的中心性存在較為顯著的相關(guān)性。
這些中心性方法僅僅依靠蛋白質(zhì)相互作用數(shù)據(jù)識別關(guān)鍵蛋白質(zhì),預(yù)測的準(zhǔn)確度比較依賴網(wǎng)絡(luò)本身的可靠性,但蛋白質(zhì)相互作用網(wǎng)絡(luò)是通過高通量生物實驗獲得,包含了很多假陽性,很大地影響了關(guān)鍵蛋白質(zhì)識別的準(zhǔn)確率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于陜西師范大學(xué),未經(jīng)陜西師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711039345.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





