[發明專利]對重構基因組尺度代謝網絡進行模塊劃分的方法有效
| 申請號: | 201410692571.6 | 申請日: | 2014-11-27 |
| 公開(公告)號: | CN104376233B | 公開(公告)日: | 2017-11-28 |
| 發明(設計)人: | 郝彤;于愛玲;孫金生 | 申請(專利權)人: | 天津師范大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 天津市杰盈專利代理有限公司12207 | 代理人: | 朱紅星 |
| 地址: | 300387 *** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因組 尺度 代謝 網絡 進行 模塊 劃分 方法 | ||
本發明由國家自然科學基金(NO.21106095)、天津師范大學引進人才基金,及天津市“三年時間引進千名以上高層次人才”項目資助。
技術領域
本發明屬于網絡模塊劃分的生物信息學技術領域,涉及對重構基因組尺度代謝網絡進行模塊劃分的方法。
背景技術
網絡模塊劃分,即網絡解耦,是指將一個復雜網絡分解為結構和功能獨立的子集(稱為模塊)的過程。隨著基因組測序等的高通量技術的快速發展,海量的生物學數據產生并積累起來,這使得構建大規模生物網絡并將之表示成復雜結構的生物系統成為可能。這些生物網絡通常具有很大的規模(可能包含上千個節點)并且由于生物功能的復雜性,網絡內部往往高度互聯。通過直觀的簡單分析或統計分析很難利用這些復雜網絡得到有用的信息。因此,為了深入地對網絡進行功能分析,需要一種方法來分解大規模網絡并確定其功能模塊。由于生物網絡結構是功能的反應,而且已經從拓撲結構上證實許多網絡是按照子模塊層次化的方式組織起來的。因而更多的算法傾向于完全從網絡拓撲結構出發將網絡分解成子模塊,使各個模塊具有一定的結構獨立性。網絡中的模塊是指在網絡中內部連接緊密但是外部連接稀疏的節點集?,F在有不同的從拓撲結構出發的網絡解耦方法被開發出來用于確定復雜網絡中的模塊。這些解耦方法能夠劃分為兩組[1]:一組是層次式聚類方法,另一組是非層次式聚類方法。
層次式聚類方法:
層次式的聚類方法分為兩組:一組是凝聚的方法,該方法通過相似性計算找到網絡中密切相關的節點,再一步步將節點合并起來直至所有節點形成一個大模塊。這種合并過程經常表示為聚類樹,功能模塊可以通過在某個水平上切割聚類樹來得到[2];另一組方法稱為分裂的方法,這種方法建立在如何有效地分解網絡(網絡魯棒性分析)的基礎上,通過找到位于模塊之間的節點或邊,通過移除這些節點或邊將網絡分解為獨立的模塊[3]。
在這兩種方法中,模塊化指標都發揮了重要的作用。模塊化指標主要用于描述網絡分解為結構和功能獨立模塊的程度。對于復雜網絡,Newman和Girvan將模塊化指標定義為[4]:
其中eii表示模塊i中邊所占的分數,計算為模塊中的邊數(li) 除以網絡中的總邊數(L),ai是表示模塊內連結性的參數,計算為模塊內節點的度之和(dj)除以整個網絡的度之和(等于變數的兩倍)。不同的網絡分解結果具有不同的模塊化指標值,因而模塊化指標可以作為確定使模塊化指標最大化的最佳分解的一個準則。
凝聚的網絡分解方法(自上而下的生物網絡解耦)首先生成具有層級結構的聚類樹,然后通過在特定水平上對樹進行水平切割得到網絡模塊。在不同水平上的切割會產生具有不同模塊化指標的劃分結果。最好的結果應當是產生最高模塊化指標的切割方法。然而,網絡的潛在解耦結果是受樹的結構限制的,當切割線移動到聚類樹較高的水平上時只有相鄰的分支能夠合并。因而,通過對聚類樹的切割得到的具有最大模塊化指標的最優解實際上是基于非常有限的解空間得到的,這個最優解可能離全局最優解相去甚遠。
相似地,模塊化指標也可以用于確定在分裂的網絡解耦方法(自下而上的生物網絡解耦)中,為了得到最優解需要移除多少邊和節點。之前的研究表明介數中心性(betweeness centrality)是確定節點或邊致死性的有效方法,因此,通過移除哪些高介數中心性的節點或邊,能夠有效地將網絡分解為獨立的模塊。當網絡中的移除的邊達到一定數量時模塊化指標會達到最大值,當超過這個數量時,由于網絡被分解為許多小模塊,模塊化指標會降低。因此,基于模塊化指標我們能夠確定網絡的最優解耦方案。然而,該方法與凝聚的網絡解耦方法具有相同的問題,具有“最大”模塊化指標的最優解實際上是從移除不同數量的點或邊得到的有限的解空間中確定的,很有可能這樣的“最優”解并不是全局最優解耦方案。
非層次式聚類方法:
非層次式聚類方法主要包括通過最大化模塊化指標進行網絡解耦的Newman算法[5]和通過直接最大化模塊化指標進行網絡解耦的模擬退火算法[6]。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津師范大學,未經天津師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410692571.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動清潔LED路燈
- 下一篇:一種LED模組
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡?,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





