[發(fā)明專利]基于多時(shí)滯因果熵的基因調(diào)控網(wǎng)絡(luò)構(gòu)建方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202010013036.9 | 申請(qǐng)日: | 2020-01-06 |
| 公開(公告)號(hào): | CN111223523B | 公開(公告)日: | 2023-10-03 |
| 發(fā)明(設(shè)計(jì))人: | 李敏;馮浩楠;鄭瑞清 | 申請(qǐng)(專利權(quán))人: | 中南大學(xué) |
| 主分類號(hào): | G16B20/00 | 分類號(hào): | G16B20/00;G16B45/00 |
| 代理公司: | 長(zhǎng)沙正奇專利事務(wù)所有限責(zé)任公司 43113 | 代理人: | 馬強(qiáng);王娟 |
| 地址: | 410083 湖南*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 多時(shí) 因果 基因 調(diào)控 網(wǎng)絡(luò) 構(gòu)建 方法 系統(tǒng) | ||
1.一種基于多時(shí)滯因果熵的基因調(diào)控網(wǎng)絡(luò)構(gòu)建方法,其特征在于,包括以下步驟:
1)將輸入的時(shí)序基因表達(dá)數(shù)據(jù)根據(jù)時(shí)滯τ劃分成不同的時(shí)間窗口;
2)對(duì)劃分窗口后的t個(gè)時(shí)間片的基因表達(dá)數(shù)據(jù),分別構(gòu)建t-τ個(gè)時(shí)間窗口下的時(shí)序基因表達(dá)矩陣,從t-τ到t-1的基因表達(dá)矩陣;
3)對(duì)t-τ個(gè)時(shí)間窗口下的時(shí)序基因表達(dá)矩陣中的每一個(gè)基因,目標(biāo)基因選擇t窗口下的表達(dá)譜,調(diào)控因子選擇t-τ窗口到t-1時(shí)間窗口下的表達(dá)譜,計(jì)算基因之間的多時(shí)滯轉(zhuǎn)移熵,得到基因相關(guān)性矩陣;
4)對(duì)基因相關(guān)性矩陣的全連通網(wǎng)絡(luò),將邊聚類分成兩類,過濾掉低概率值的一類邊,對(duì)剩下的每一條邊,計(jì)算在不同條件基因下的多時(shí)滯因果熵,過濾掉最大因果熵低于閾值θ的間接調(diào)控的邊,得到最終的基因調(diào)控網(wǎng)絡(luò)。
2.根據(jù)權(quán)利要求1所述的基于多時(shí)滯因果熵的基因調(diào)控網(wǎng)絡(luò)構(gòu)建方法,其特征在于,步驟1)中,根據(jù)時(shí)滯τ劃分不同的時(shí)間窗口Gτ的表達(dá)式為:
其中,表示在時(shí)間窗口表達(dá)矩陣Gτ中基因N在樣本M時(shí)間窗口T下的表達(dá)值;T表示在哪個(gè)移動(dòng)時(shí)間窗口下的基因表達(dá)向量;N代表基因的下標(biāo)N∈基因的數(shù)目;M代表樣本細(xì)胞的下標(biāo)M∈樣本的數(shù)目。
3.根據(jù)權(quán)利要求1所述的基于多時(shí)滯因果熵的基因調(diào)控網(wǎng)絡(luò)構(gòu)建方法,其特征在于,步驟3)中,基因之間的多時(shí)滯轉(zhuǎn)移熵TX→Y的計(jì)算公式為:
TX→Y=I(Yt,Xt-1:t-τ|Yt-1:t-τ)
=H(Yt|Yt-1:t-τ)-H(Yt|Yt-1::t-τ,Xt-1:t-τ);
其中I(Yt,Xt-1:t-τ|Yt-1:t-τ)代表Yt,Xt-1:t-τ在條件變量Yt-1:t-τ的條件互信息:
其中Px,y,z(x,y,z)代表聯(lián)合概率密度,Pz(z)代表邊際概率密度,Px,z(x,z)代表變量x,z之間的邊際概率密度;
Xt-1:t-τ表示基因x在t-1到t-τ時(shí)間窗口下的表達(dá)值,H(·|·)代表?xiàng)l件熵:
其中P(x,y)代表聯(lián)合概率,p(x)代表邊際概率密度。
4.根據(jù)權(quán)利要求1所述的基于多時(shí)滯因果熵的基因調(diào)控網(wǎng)絡(luò)構(gòu)建方法,其特征在于,步驟4)中,過濾掉最大因果熵低于閾值θ的間接調(diào)控的邊的具體實(shí)現(xiàn)過程包括:
1)對(duì)于基因相關(guān)性矩陣Gzero-order,過濾低表達(dá)值的邊,根據(jù)k-means將邊聚類分成兩簇,過濾掉低概率值的簇中的邊;所述基因相關(guān)性矩陣中的元素代表基因之間存在調(diào)控關(guān)系的概率;
2)基于路徑一致性算法過濾間接調(diào)控的邊,對(duì)過濾后的網(wǎng)絡(luò)中存在的每一條邊(X,Y),如果存在邊(Y,Z)和邊(X,Z)對(duì)每一條邊存在的相鄰的點(diǎn)Z,視作條件基因,計(jì)算條件基因下的因果熵CEX→Y|Z=I(Yt;Xt-1:t-τ|Zt-1:t-τ);
3)對(duì)基因X,Y的條件基因集合K∈{K1,K2,K3…Kn},過濾多個(gè)條件基因的最大的因果熵maxZ∈k{CEX→Y|Z}小于閾值θ的邊。
5.根據(jù)權(quán)利要求1所述的基于多時(shí)滯因果熵的基因調(diào)控網(wǎng)絡(luò)構(gòu)建方法,其特征在于,閾值=0.03。
6.一種基于多時(shí)滯因果熵的基因調(diào)控網(wǎng)絡(luò)構(gòu)建系統(tǒng),其特征在于,包括以下步驟:
輸入單元,用于將輸入的時(shí)序基因表達(dá)數(shù)據(jù)根據(jù)時(shí)滯τ劃分成不同的時(shí)間窗口;
基因表達(dá)矩陣構(gòu)建單元,用于對(duì)劃分窗口后的t個(gè)時(shí)間片的基因表達(dá)數(shù)據(jù),分別構(gòu)建t-τ個(gè)時(shí)間窗口下的時(shí)序基因表達(dá)矩陣,從t-τ到t-1的基因表達(dá)矩陣;
基因相關(guān)性矩陣構(gòu)建單元,用于對(duì)t-τ個(gè)時(shí)間窗口下的時(shí)序基因表達(dá)矩陣中的每一個(gè)基因,目標(biāo)基因選擇t窗口下的表達(dá)譜,調(diào)控因子選擇t-τ窗口到t-1時(shí)間窗口下的表達(dá)譜,計(jì)算基因之間的多時(shí)滯轉(zhuǎn)移熵,得到基因相關(guān)性矩陣;
聚類單元,用于對(duì)基因相關(guān)性矩陣的全連通網(wǎng)絡(luò),將邊聚類分成兩類,過濾掉低概率值的一類邊,對(duì)剩下的每一條邊,計(jì)算在不同條件基因下的多時(shí)滯因果熵,過濾掉最大因果熵低于閾值θ的間接調(diào)控的邊,得到最終的基因調(diào)控網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南大學(xué),未經(jīng)中南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010013036.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于行為時(shí)間序列的社交網(wǎng)絡(luò)因果關(guān)系發(fā)現(xiàn)算法
- 一種自底向上的高維數(shù)據(jù)因果網(wǎng)絡(luò)學(xué)習(xí)方法
- 情態(tài)生成裝置以及計(jì)算機(jī)可讀取記錄介質(zhì)
- 對(duì)短文本進(jìn)行常識(shí)性因果推理的方法
- 一種基于動(dòng)量動(dòng)力學(xué)模型的行人間因果關(guān)系識(shí)別方法
- 因果句解析裝置、因果句解析系統(tǒng)、程序以及因果句解析方法
- 訂單歸因方法及裝置
- 一種基于因果推理對(duì)玻璃熔爐環(huán)境控制的方法及系統(tǒng)
- 一種結(jié)合知識(shí)圖譜和自動(dòng)變分編碼的因果發(fā)現(xiàn)方法
- 一種基于弱證據(jù)聚合的常識(shí)因果推理方法及系統(tǒng)
- 心腦血管疾病易感基因芯片檢測(cè)試劑盒
- 一組用于頭頸部鱗狀細(xì)胞癌分子分型的基因及其應(yīng)用
- 產(chǎn)β-丙氨酸的重組菌及其構(gòu)建方法與應(yīng)用
- 一種檢測(cè)高血壓藥物代謝相關(guān)基因的引物組和試劑盒
- 一組用于腎細(xì)胞癌分子分型的基因及其應(yīng)用
- 一組用于膀胱癌檢測(cè)的基因及其應(yīng)用
- 一組用于髓母細(xì)胞瘤分子分型的基因及其應(yīng)用
- 一種頭發(fā)相關(guān)的基因位點(diǎn)庫及其應(yīng)用
- 馬度米星化合物的生物合成基因簇及其應(yīng)用
- 彌漫性大B細(xì)胞淋巴瘤分子分型試劑盒及分型裝置





