[發明專利]整合拓撲屬性和功能的蛋白質生物網絡模體識別方法有效
| 申請號: | 201310307364.X | 申請日: | 2013-07-22 |
| 公開(公告)號: | CN103514381A | 公開(公告)日: | 2014-01-15 |
| 發明(設計)人: | 駱嘉偉;李光輝;王偉勝;江海;劉智明;蔡潔 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06F17/30 |
| 代理公司: | 長沙市融智專利事務所 43114 | 代理人: | 黃美成 |
| 地址: | 410082*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 整合 拓撲 屬性 功能 蛋白質 生物 網絡 識別 方法 | ||
技術領域
本發明屬于系統生物學領域,涉及一種整合拓撲屬性和功能的蛋白質生物網絡模體識別方法。?
背景技術
在后基因組時代,為更好地理解生物分子交互和運作的機制,功能基因組學研究的主要目標是識別和分析細胞環境中的分子相互作用。蛋白質相互作用是一種特定類型分子相互作用,在傳送信號、構建分子機器、參與酶反應等生物過程中起著核心作用。近年來,隨著高通量蛋白質組技術的發展,可獲得的蛋白質相互作用數據迅速增長。蛋白質相互作用被構建為無向圖(其中頂點對應蛋白質,邊對應蛋白質之間的相互作用)有助于從網絡水平上理解細胞機制的基本構件和組織。蛋白質相互作用網絡類似于復雜網絡,擁有小世界和無尺度等全局特性。而在2002年由R.Milo等首次提出的網絡模體則是其中非常重要的一種局部性質,網絡模體定義為一種在給定網絡中頻繁出現的連通子圖,并且其出現的次數要多于在相應的隨機網絡中的次數,被認為是復雜網絡的基本構件塊。所以,有效地識別網絡模體對預測蛋白質相互作用、預測關鍵蛋白質及解釋特定的生物進程具有十分重要的意義。?
網絡模體發現的計算復雜度非常高,它涉及到子圖的同構測試及需要產生大量的隨機網絡來確定子圖的唯一性。現有的網絡模體發現方法主要有精確的枚舉法和近似的采樣方法。窮盡遞歸搜索(ERS)、枚舉子圖(ESU)和緊湊的拓撲模體屬于精確方法。邊采樣方法(ESA)、頂點采樣方法(RAND-ESU)及樹過濾搜索方法(NEMOFINDER)屬于近似方法。最近,Kim等人首次定義生物網絡模體為生物上具有顯著性的小的連通子圖,并指出傳統結構上的網絡模體不足以解釋模體的生物意義,因為部分結構上的非模體也具有生物意義;為有效的發現生物網絡模體,Kim提出了EDGEGO-BNM,EDGEBETWEENNESS-BNM,NMF-BNM,NMFGO-BNM和VOLTAGE-BNM五種方法,實驗結果表明,基于蛋白質對的?共同GO短語深度的EDGEGO-BNM方法和基于邊介數的EDGEBETWEENNESS-BNM方法評價結果優于其他方法。?
盡管Kim等提出的方法能較好的發現生物網絡模體,但仍有幾個挑戰是研究者必須面對的。首先,目前每一個物種的蛋白質相互作用數據是不完整的;其次,蛋白質相互作用數據存在大量假陽性,特別是從大規模高通量實驗得到的數據。對于假陽性,一般是通過使用不同的權重方法來評估相互作用的可靠性。此外,網絡模體被認為是復雜網絡的基本構件塊,且樹形結構的子圖通常不是模體,那么網絡模體中的相互作用是傾向于形成高密度連通的簇。?
因此,有必要設計一種整合拓撲屬性和功能的蛋白質生物網絡模體識別方法。?
發明內容
本發明所要解決的技術問題是提供一種整合拓撲屬性和功能的蛋白質生物網絡模體識別方法,該整合拓撲屬性和功能的蛋白質生物網絡模體識別方法只需根據PPI信息和基因本體論信息就能夠較準確地識別大量的具有生物意義的網絡模體,且對蛋白質相互作用大規模數據中普遍存在的比例較高的假陽性具有很好的健壯性。?
發明的技術解決方案如下:?
一種整合拓撲屬性和功能的蛋白質生物網絡模體識別方法,包括以下步驟:?
1)建立蛋白質相互作用無向圖:?
輸入一組蛋白質相互作用信息,過濾掉其中的重復相互作用和自相互作用,建立蛋白質相互作用無向圖G;重復相互作用指一對蛋白質相互作用信息被記錄了2次及以上【其被多種實驗方法所證實而得到】;?
其中,蛋白質相互作用信息指蛋白質-蛋白質關聯及其關聯可靠性計分的集合;每一對蛋白質-蛋白質關聯的成員是具有直接相互作用的兩個蛋白質;?
2)計算蛋白質相互作用無向圖G中每條邊的生物顯著性值;?
3)將蛋白質相互作用無向圖G中的每條邊按照生物顯著性值以非遞減的順序排序,刪除最前的r條的邊【即較小的生物顯著性值的r條邊】,得到圖G';?
4)采用ESU方法枚舉圖G'中所有k個頂點的導出子圖,所有被查找到的子圖即所要識別的生物網絡模體,整個識別過程結束;?
所述的ESU方法為枚舉子圖法。?
所述的生物顯著性值由下式計算:?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310307364.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:人體排毒儀
- 下一篇:一種農用噴霧器無滴漏水的噴啃裝置
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





