[發明專利]一種基于功能模塊的疾病關聯因子識別方法及系統在審
| 申請號: | 201710035109.2 | 申請日: | 2017-01-18 |
| 公開(公告)號: | CN106874706A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 駱嘉偉;宋丹;蔡潔;王偉勝;劉智明 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18;G06F19/24 |
| 代理公司: | 長沙市融智專利事務所43114 | 代理人: | 龔燕妮 |
| 地址: | 410082 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 功能模塊 疾病 關聯 因子 識別 方法 系統 | ||
1.一種基于功能模塊的疾病關聯因子識別方法,其特征在于,包括以下步驟:
步驟一:構建人類共調控網絡,利用功能模塊識別方法從人類共調控網絡中識別miRNA、轉錄因子和基因的功能模塊,并計算每個功能模塊的疾病關聯值;
步驟二:依據每個功能模塊的疾病關聯值,篩選出疾病關聯模塊;
步驟三:將每個疾病關聯模塊中的非差異表達的miRNA、轉錄因子和基因作為候選疾病關聯因子;
步驟四:根據候選疾病關聯因子在各個功能模塊內與差異表達基因的距離分布,計算候選疾病關聯因子與疾病的關聯值,并根據候選疾病關聯因子與疾病的關聯值大小對候選疾病關聯因子從大到小排序,識別出疾病關聯因子;
所述功能模塊的疾病關聯值Rj按照以下公式計算獲得:
其中,n為功能模塊Mj內部節點個數,表示功能模塊Mj內部節點中的第p個目標基因Mjp的z-score值,通過對目標基因Mjp的差異表達基因的p-value值進行逆正態累積分布轉換獲得;k為功能模塊Mj內部節點中的目標基因個數;目標基因的差異表達基因的p-value值是根據疾病樣本和正常樣本的基因表達譜獲得;
所述依據每個功能模塊的疾病關聯值,篩選出疾病關聯模塊是指首先對功能模塊的疾病關聯值進行歸一化處理,然后對歸一化處理后的結果進行逆正太累積分布轉換成p-value值,若p-value值小于0.05,則對應的功能模塊為疾病關聯模塊;
歸一化處理公式為:
其中,μj為功能模塊Mj對應的10000個隨機模塊rmij的疾病關聯值的平均值,σj為10000個隨機模塊rmij的疾病關聯值的標準方差;功能模塊Mj對應的隨機模塊rmij的內部節點從共調控網絡中隨機選擇,0≤i<10000,且規模與模塊Mj規模一致;
所述候選疾病關聯因子與疾病的關聯值按照以下公式計算:
其中,|BAM|為候選疾病關聯因子所屬的疾病關聯模塊個數,nxy表示候選疾病關聯因子與第x個疾病關聯模塊中的差異表達基因之間最短路徑長度為y的差異表達基因個數,D和y分別為候選疾病關聯因子與第x個疾病關聯模塊中的各差異表達基因之間最短路徑長度的最大值和最小值;
DID的值越高,則候選疾病關聯因子與疾病的關聯度越高。
2.根據權利要求1所述的方法,其特征在于,所述步驟一中的人類共調控網絡包括人類物種的轉錄因子、miRNA和目標基因三種類型的節點,以及各個節點之間的相互作用。
3.根據權利要求2所述的方法,其特征在于,所述從人類共調控網絡中識別miRNA、轉錄因子和基因的功能模塊采用基于調控子模塊和基因模塊間帶重啟的隨機游走的算法。
4.一種基于功能模塊的疾病關聯因子識別系統,其特征在于,包括:
人類共調控網絡構建單元,用于利用功能模塊識別方法從人類共調控網絡中識別miRNA、轉錄因子和基因的功能模塊,并計算每個功能模塊的疾病關聯值;
疾病關聯模塊篩選單元,依據每個功能模塊的疾病關聯值,篩選出疾病關聯模塊;
候選疾病關聯因子確定單元,將每個疾病關聯模塊中的非差異表達的miRNA、轉錄因子和基因作為候選疾病關聯因子;
候選疾病關聯因子與疾病的關聯值計算單元,根據候選疾病關聯因子在各個功能模塊內與差異表達基因的距離分布,計算候選疾病關聯因子與疾病的關聯值;
疾病關聯因子識別單元,根據候選疾病關聯因子與疾病的關聯值大小對候選疾病關聯因子從大到小排序,識別出疾病關聯因子;
所述每個功能模塊的疾病關聯值的計算以及篩選過程,候選疾病關聯因子與疾病的關聯值的計算過程按照權利要求1-3任一項所述的方法進行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710035109.2/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





