[發(fā)明專利]一種識別癌癥驅(qū)動通路的方法有效
| 申請?zhí)枺?/td> | 202011185104.6 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112270952B | 公開(公告)日: | 2022-04-05 |
| 發(fā)明(設(shè)計)人: | 朱凱;吳璟莉;李高仕 | 申請(專利權(quán))人: | 廣西師范大學(xué) |
| 主分類號: | G16B20/10 | 分類號: | G16B20/10;G16B20/50 |
| 代理公司: | 桂林市華杰專利商標(biāo)事務(wù)所有限責(zé)任公司 45112 | 代理人: | 楊雪梅 |
| 地址: | 541004 廣西壯*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 癌癥 驅(qū)動 通路 方法 | ||
1.一種識別癌癥驅(qū)動通路的方法,其特征在于,包括如下步驟:
1)構(gòu)造加權(quán)的非二進(jìn)制突變矩陣:
現(xiàn)有某個癌癥的體細(xì)胞突變矩陣拷貝數(shù)變異矩陣和基因表達(dá)矩陣在體細(xì)胞突變矩陣拷貝數(shù)變異矩陣和基因表達(dá)矩陣三個矩陣中行表示該癌癥的相同樣本集p,列分別表示基因集GS、GC和GE,在矩陣中,sij∈{0,1}(i=1,2,…,|p|,j=1,2,…,|GS|),i樣本中j基因突變,sij值為1,反之值為0;矩陣中每個元素cij∈{-2,-1,0,1,2}(i=1,2,…,|p|,j=1,2,…,|GC|),表示i樣本中j基因拷貝數(shù)變異值;在矩陣中eij∈R(i=1,2,…,|p|,j=1,2,…,|GE|),表示i樣本中j基因表達(dá)量;令矩陣中的基因集為GA=GS∪GC,樣本集為p,令aij∈{0,1}(i=1,2,…,|p|,j=1,2,…,|GA|),其中為突變矩陣,當(dāng)sij取值為1或i樣本中j基因處于統(tǒng)計顯著變異區(qū)域時,aij值為1,反之值為0,為了進(jìn)一步整合突變矩陣和表達(dá)矩陣在突變矩陣和表達(dá)矩陣中取基因集G=GA∩GE,重新得到兩個矩陣A|p|×|G|和E|p|×|G|,對于基因表達(dá)數(shù)據(jù),存在正常樣本表達(dá)矩陣N|n|×|G|,n表示正常樣本,在矩陣N|n|×|G|中,nij∈R(i=1,2,…,|p|,j=1,2,…,|G|),表示i樣本中j基因表達(dá)量,令差異倍數(shù)矩陣D|p|×|G|,dij∈R(i=1,2,…,|p|,j=1,2,…,|G|),表示i樣本中j基因表達(dá)量相比j基因在正常樣本中表達(dá)量的差異倍數(shù)用表示,其中則dij值為否則dij值為0,處理好差異倍數(shù)矩陣D|p|×|G|,進(jìn)一步對突變矩陣A|p|×|G|進(jìn)行加權(quán)處理,整合成加權(quán)突變矩陣,對于A|p|×|G|,如果aij=1,并且dij≥λ1,則aij=1.5,如果aij=0,并且dij≥λ2,則aij=(2·l)-1·dij,其中λ1和λ2是截取差異倍數(shù)的閾值,l是j基因?qū)?yīng)所有樣本中差異倍數(shù)的最大值,針對突變基因,λ1取較低值,使aij∈{1,1.5},以提高該突變基因的突變可信值;針對不突變基因,λ2取較高值,使aij∈[0,0.5],以提高該不突變基因的突變可信值,使其可能成為潛在基因,經(jīng)過加權(quán)重新得到加權(quán)突變矩陣A|p|×|G|,aij∈[0,1.5](i=1,2,…,|p|,j=1,2,…,|G|);
2)設(shè)定識別模型:
針對加權(quán)突變矩陣A|p|×|G|,基于高覆蓋和高互斥兩個特性,重新構(gòu)建新的整合模型,假設(shè)M|p|×k為矩陣A|p|×|G|的任一子矩陣,令Γ(m)={mi|mi=max{aim|m∈M},i=1,2,…,|p|}記錄矩陣M|p|×k每行中最大權(quán)值,令矩陣M|p|×k的覆蓋度對于矩陣M|p|×k中一行的互斥度,考慮這一行的離散程度,用變異系數(shù)計算每行的互斥度,每行互斥度之和為整個M|p|×k的互斥度,具體表示如公式(1)所示:
其中當(dāng)趨近于0值時,對于變異系數(shù)值影響很大,所以如果M|p|×k中一行的最大權(quán)值mi≤0.5,則令該行的互斥度為放縮該行互斥度,避免該行互斥度過高對通路識別造成影響,根據(jù)和公式(1),對整合數(shù)據(jù)后的最大權(quán)重子矩陣問題重新定義模型:給定突變加權(quán)矩陣A|p|×|G|和正整數(shù)k(k<|G|),在矩陣A|p|×|G|中確定矩陣M|p|×k,使函數(shù)值W(M)最大,如公式(2)所示:
W(M)=α(M)+ω(M) (2),
其中α(M)表示矩陣M|p|×k的覆蓋度,α(M)由矩陣M|p|×k中每行最大突變權(quán)值相加所得,α(M)越大表示覆蓋樣本越多,并且突變可信值也越大;ω(M)表示矩陣M|p|×k的互斥度,ω(M)由M中每行變異系數(shù)值相加所得,變異系數(shù)越大,則離散程度越高,其互斥度就越大;
3)設(shè)定適應(yīng)度函數(shù):
每個染色體對應(yīng)一個問題解,因此需要對該解進(jìn)行評估,給定染色體Xi(i=1,2,…P),P為種群大小,適應(yīng)度函數(shù)Fitness(Xi)的定義如公式(3)所示:
其中,表示染色體Xi對應(yīng)的子矩陣;
4)設(shè)定交叉算子:
按照染色體適應(yīng)度從大到小,給染色體Xi一個排名Ri,則每個染色體被選中的概率如公式(4)所示:
為了保證染色體的可行性,采用輪盤賭隨機(jī)從父種群選取兩條染色體,重復(fù)基因分別給子代的兩條染色體,剩余基因放在一個集合,采用均勻交叉的方式,對于剩余基因的集合中連續(xù)的每對基因,隨機(jī)生成一個二值數(shù)據(jù),如果該二值數(shù)據(jù)為1,則這對基因的第一個基因放入第一條子染色體,第二個基因放入第二條子染色體,反之,第一個基因放入第二條子染色體,第二個基因放入第一條子染色體,經(jīng)過一次交叉,生成兩個子染色體;
5)設(shè)定變異算子:
給定一條子染色體X={x1,x2,…,xk}(xi=1,2,…,|G|),確定候選基因集合從子染色體中隨機(jī)刪除一個基因,得到基因集X′,將HX中基因順序打亂,遍歷前個基因,選出基因g,使適應(yīng)值Fitness(MX′∪{g})最大,對應(yīng)于子矩陣MX′∪{g}的基因集X′∪{g}為新子染色體,即X=X′∪{g};
6)設(shè)定合作策略:
采用種群間相互合作策略,在種群交叉、變異和選擇操作后,比較兩個種群適應(yīng)度最好的染色體和對方適應(yīng)度最差的染色體,如果最好適應(yīng)度高于對方最差適應(yīng)度,則將該條染色體替換對方適應(yīng)度最差的染色體;
7)設(shè)定參數(shù):
輸入加權(quán)的非二進(jìn)制突變矩陣A|p|×|G|和公式(2)中的模型,參數(shù)k用于限制找到的驅(qū)動通路大小,然后輸入CGA-MWS相關(guān)參數(shù):種群規(guī)模P、變異概率Pm、最大演化代數(shù)maxstep、最優(yōu)值保持恒定的閾值maxt;
8)構(gòu)造初始種群:
染色體編碼采用十進(jìn)制編碼方式,一個解為k個基因構(gòu)成的集合,即X={x1,x2,…,xk}(xi=1,2,…,|G|),將|G|個基因順序隨機(jī)打亂,然后取前k個基因構(gòu)成初始染色體,生成兩個初始種群pop0和pop1,每個種群大小為P/2,計算兩個種群各自染色體的適應(yīng)值,將pop0和pop1中各自最優(yōu)的染色體相比較,保存最好的個體到變量best中,初始迭代次數(shù)step=0,最優(yōu)值保持恒定的代數(shù)t=0;
9)執(zhí)行迭代操作:
(1)若step>maxstep或t>maxt,轉(zhuǎn)入步驟9)的(4),得到大小為k的驅(qū)動通路,否則轉(zhuǎn)入步驟9)的(2);
(2)種群pop0和pop1各自通過基于排名的概率,采用輪盤賭隨機(jī)選兩條父代染色體,通過交叉算子進(jìn)行交叉,生成兩條子染色體,并各自放入子種群pop0′和pop1′中,重復(fù)P/4次,針對子種群pop0′和pop1′,對每條染色體隨機(jī)一個突變概率Pm′,如果Pm′<Pm,則對該條染色體進(jìn)行變異操作,將變異操作中得到的適應(yīng)值最高的染色體替換該條染色體,將pop0和pop0′里所有染色體按適應(yīng)值從高到低排序,取前P/2條染色體放入下一代種群popstep+1中,pop1和pop1′進(jìn)行相同操作得到下一代種群popstep+2;
(3)對種群popstep+1和popstep+2進(jìn)行合作策略操作,比較兩個種群的最優(yōu)適應(yīng)值,取兩者中適應(yīng)值最高的染色體,若該染色體適應(yīng)值大于best染色體的適應(yīng)值,則更新best染色體,t=0;否則t=t+1,step=step+1,返回步驟9)的(1);
(4)將best染色體轉(zhuǎn)換為基因集,由此得到子矩陣M,并子矩陣M其輸出,輸出的子矩陣M即為大小為k的驅(qū)動通路。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣西師范大學(xué),未經(jīng)廣西師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011185104.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





