[發明專利]一種基于功能模塊的疾病關聯因子識別方法及系統在審
| 申請號: | 201710035109.2 | 申請日: | 2017-01-18 |
| 公開(公告)號: | CN106874706A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 駱嘉偉;宋丹;蔡潔;王偉勝;劉智明 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06F19/24 |
| 代理公司: | 長沙市融智專利事務所43114 | 代理人: | 龔燕妮 |
| 地址: | 410082 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 功能模塊 疾病 關聯 因子 識別 方法 系統 | ||
本發明提供了一種基于功能模塊的疾病關聯因子識別方法及系統,該方法包括:1)在人類共調控網絡上識別包括轉錄因子、miRNA和目標基因的功能模塊;2)獲得差異表達基因的p?value值,根據模塊內差異表達基因的組合確定疾病關聯功能模塊;3)將疾病關聯功能模塊中的非差異表達轉錄因子、miRNA和目標基因作為候選疾病關聯因子;4)計算候選疾病關聯因子與疾病的關聯值,并根據關聯值為候選疾病關聯因子排序。該方法識別疾病關聯因子時結合了多種相互作用關系,即使在不知道轉錄因子、miRNA和基因功能的情況下,應用本發明所述方法能夠進行預測識別疾病關聯因子,且本發明預測疾病關聯因子的準確率非常高。
技術領域
本發明屬于生物信息學領域,涉及一種基于功能模塊的疾病關聯因子識別方法及系統。
背景技術
疾病相關miRNA、轉錄因子和基因的識別對于從分子水平上研究和揭示復雜疾病發病機制具有顯著的意義。測序技術極大的促進了人們對miRNA、轉錄因子和基因的功能的研究,基因信息和基因表達譜陣列也越來越多的被用來輔助分析復雜疾病。科學界廣泛認為病人的關鍵因子的綜合分子特征,比如基因表達,是研究復雜疾病治療的關鍵。細胞面對環境壓力時,主要通過改變基因表達產生需要的蛋白質,因此面對環境壓力產生正確的蛋白質至關重要。而異常表達的miRNA和基因則可能導致疾病的發生。比如一些miRNA表現出致病的特性,異常表達就會促進疾病的發生。還有一些miRNA具有抑制疾病的作用,降低致病基因的生成,異常表達時將會使致病基因快速增長,最終導致疾病的產生。
當前研究人員提出許多生物信息學方法通過分析公共和私有基因組數據來尋找疾病相關的miRNA、轉錄因子和基因。這些生物信息學技術最早關注疾病樣本和控制樣本中候選基因的重新排序,在多基因中輔助識別致病基因。除了位置上的致病基因排序,也提出了從多種基因列表中識別可能的候選基因的方法,如從微陣列或者蛋白質組實驗中獲得差異表達基因。為候選基因進行排序時需要輸入一列需要進行排序的候選基因和排列標準,如包括在特定疾病或者細胞過程中。這些排列標準主要以生物關鍵詞的形式出現或者是一系列與疾病或者生物過程關聯的種子基因(即訓練基因)。基因排序的方法是基于因有關聯而被認為有罪(guilt by association)的思想。通過查詢包括基因或蛋白質之間簡單關系的數據庫,如蛋白質相互作用數據庫,來發現基因之間未知的關系。因此,基因能夠根據與其他已確定的疾病關聯基因之間推測的關系而進行排列。大規模組數據的出現,如高通量序列數據,迫切需要高效的疾病關聯因子識別方法。同時機器學習方法的進步也極大的發展了識別方法。
Perez-Iratxeta等人基于模糊集理論設計了一個數據挖掘系統為455個疾病查找關聯基因,此方法能夠識別潛在的疾病關聯基因。Lage等人進一步結合基于網絡的方法以及表型相似性來預測疾病相關的基因,但是此方法只考慮了網絡的局部信息,即網絡中候選基因或致病基因的直接鄰居,會忽略一些功能信息。而Li和Patra通過在異構網絡上進行隨機游走識別與表型關聯度高的基因,綜合考慮了網絡的全局特性。
通過結合多數據源構建的網絡來進行疾病相關miRNA、轉錄因子和基因的預測是現今研究疾病基因的主要方法。但仍然存在一些挑戰。首先,所提出的的方法結合的信息較少,沒有體現miRNA、轉錄因子和基因在疾病發生過程中共同協作的關系。此外已有的方法不適用于預測未知功能的miRNA、轉錄因子和基因與疾病的關系。
因此,有必要設計一種基于功能模塊的疾病關聯因子識別方法。
發明內容
本發明提出了一種基于功能模塊的疾病關聯因子識別方法及系統,通過結合疾病樣本和正常樣本的基因表達譜,獲得差異表達基因的p-value值;并依此計算人類共調控網絡中識別的功能模塊的疾病關聯值,來確定疾病關聯模塊;進一步在疾病關聯模塊中根據候選miRNA、轉錄因子和基因的疾病關聯值查找疾病關聯因子,預測疾病關聯因子的準確率非常高。
一種基于功能模塊的疾病關聯因子識別方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710035109.2/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





