[發(fā)明專利]基于RNN的基因調控網絡構建與動態(tài)差異性分析方法有效
| 申請?zhí)枺?/td> | 201710355357.5 | 申請日: | 2017-05-19 |
| 公開(公告)號: | CN107220525B | 公開(公告)日: | 2021-06-18 |
| 發(fā)明(設計)人: | 陳晉音;鄭海斌;熊暉;吳洋洋;李南;應時彥 | 申請(專利權)人: | 浙江工業(yè)大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B5/00 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 rnn 基因 調控 網絡 構建 動態(tài) 差異性 分析 方法 | ||
一種基于RNN的基因調控網絡構建與動態(tài)差異性分析方法,包括以下步驟:第一步、基于deepRNN的基因動態(tài)調控網絡構建;第二步、基于亞型內動態(tài)調控網絡的時序變化演化分析;第三步、基于亞型間動態(tài)調控網絡的網絡差異演化分析,不同亞型網絡的演化分析包括動力學分析、差異性分析和擾動分析。本發(fā)明提供一種精確性較好的基于RNN的基因調控網絡構建與動態(tài)差異性分析方法。
技術領域
本發(fā)明涉及一種基于RNN的基因調控網絡構建與動態(tài)差異性分析方法。
背景技術
基因調控網絡的建模與演化分析能夠很好的挖掘基因表達數(shù)據(jù)中的深層信息,是當前生物信息學研究的重要領域和關鍵問題。二十世紀90年代以來,隨著基因芯片技術的發(fā)展和二代測序技術的興起,基因調控網絡建模的研究取得了巨大進展。
基因調控網絡建模主要根據(jù)基因表達數(shù)據(jù)推理網絡中的調控關系,并表示為拓撲結構,屬于依靠數(shù)據(jù)挖掘進行的逆向工程研究。構建基因調控網絡首先需要確定網絡模型,然后根據(jù)模型選擇合適的建模算法。經典的網絡模型包括布爾網絡、關聯(lián)網絡、微分方程、貝葉斯網絡。
(a)布爾網絡。布爾網絡對基因狀態(tài)做了相應簡化,用布爾函數(shù)代替了微分和導數(shù)描述基因間的相互關系。該模型的缺點在于不精確性,僅僅通過使用固定的邏輯規(guī)則刻畫和反映基因間相互作用,并不能準確描述真實的基因調控網絡拓撲結構,而且對基因數(shù)據(jù)進行離散化時不可避免的會造成很多重要的表達信息丟失。Kauffman等人最先提出了布爾網絡的分析框架模型,隨后Akusu等人對布爾網絡在推理過程中的最少樣本數(shù)進行證明。Liang等人設計了REVEAL算法,在原有的離散化模型上盡可能少的減少信息損失。此外,Lyla等人提出了一種新的概率布爾網絡(PBN),這是對傳統(tǒng)布爾網絡的拓展,同時量化基因間作用關系和靈敏度從而解決模型選擇過程中的不確定性,提高了模型的精確性。
(b)關聯(lián)網絡。關聯(lián)網絡的建模主要通過基因表達數(shù)據(jù)間的關聯(lián)度實現(xiàn)。通常使用互信息、皮爾森相關系數(shù)等測度計算基因間的相似度,若基因對間的相似度高于某一閾值,則該基因對在網絡中直接連通。Butte等人首先利用互信息計算所有基因對之間的關聯(lián)度,然后設置互信息閾值。后來發(fā)現(xiàn),若基因對間具有相同或相近的調控機制,則兩個基因的關聯(lián)度較高,尤其是同一轉錄因子的靶基因或同一條生物通路上的基因。Margolin等人提出ARCANE方法,通過信息論構建關聯(lián)網絡,該方法的優(yōu)點是模型的建立簡單易操作,但是構建的網絡存在很多假陽性的邊。為降低所構建網絡結構的假陽性率,得到接近真實拓撲的調控網絡,一般在計算基因對間的關聯(lián)度時隔絕其它基因的影響。
(c)貝葉斯網絡。貝葉斯網絡(BN)通過局部概率的乘積來近似描述整體網絡結構的復雜概率分布,屬于概率圖模型,將節(jié)點之間的連邊表示為節(jié)點間存在的概率依賴關系。動態(tài)貝葉斯網絡(DBN)是對靜態(tài)貝葉斯網絡模型的擴展,通過引入時間因素形成動態(tài)變化網絡,更加真實地表示隨機系統(tǒng)的動態(tài)性。基因調控網絡本質上是一個復雜而連續(xù)的動態(tài)網絡系統(tǒng),所以在具體建模的時候,往往對DBN進行簡化從而降低計算復雜度。DBN克服了靜態(tài)BN有向無環(huán)的不足,更好地刻畫了基因調控網絡的動態(tài)特性,提高了模型的預測精度。Norbert為了能夠從基因擾動型實驗數(shù)據(jù)中學習動態(tài)貝葉斯網絡,利用離散化方法來對基因表達數(shù)據(jù)進行預處理,結合基因調控的負反饋與時延因素提出新的數(shù)據(jù)整合模型,利用并行算法加速構建基因調控網絡。
隨著2006年Hinton教授在《科學》上的一篇文章,深度學習拉開帷幕,并在各個領域表現(xiàn)不俗。同時,學術界和行業(yè)都強調了深度學習的洞察力在生物信息學中的應用,例如基于深度學習的蛋白質結構預測、基因調控碼學習、基因表達預測、癌癥分類預測、復雜疾病分類、多平臺癌癥數(shù)據(jù)綜合分析等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業(yè)大學,未經浙江工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710355357.5/2.html,轉載請聲明來源鉆瓜專利網。





