[發(fā)明專(zhuān)利]一種基于復(fù)雜網(wǎng)絡(luò)的腫瘤轉(zhuǎn)移關(guān)鍵基因檢索方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010004969.1 | 申請(qǐng)日: | 2020-01-03 |
| 公開(kāi)(公告)號(hào): | CN111192639A | 公開(kāi)(公告)日: | 2020-05-22 |
| 發(fā)明(設(shè)計(jì))人: | 楊天濠;徐晨曦;王子赫 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)石油大學(xué)(華東) |
| 主分類(lèi)號(hào): | G16B40/00 | 分類(lèi)號(hào): | G16B40/00;G16B20/00;G16B5/00 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 266580 山*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 復(fù)雜 網(wǎng)絡(luò) 腫瘤 轉(zhuǎn)移 關(guān)鍵 基因 檢索 方法 | ||
1.一種基于復(fù)雜網(wǎng)絡(luò)的腫瘤轉(zhuǎn)移關(guān)鍵基因檢索方法,其特征即具體步驟如下:
S1,通過(guò)從STRING等在線數(shù)據(jù)庫(kù)中獲取蛋白質(zhì)相互作用數(shù)據(jù),構(gòu)建PPI(protein-protein interaction)網(wǎng)絡(luò);
S2,根據(jù)已知的腫瘤轉(zhuǎn)移類(lèi)型(腫瘤A向腫瘤B轉(zhuǎn)移),從不同數(shù)據(jù)庫(kù)中分別收集和整理腫瘤A和腫瘤B的相關(guān)基因數(shù)據(jù),其集合定義為Sa和Sb,并對(duì)基因數(shù)據(jù)進(jìn)行預(yù)處理,使其對(duì)應(yīng)在PPI網(wǎng)絡(luò)中;
S3,將S2中得到的基因整合作為種子節(jié)點(diǎn),在PPI網(wǎng)絡(luò)上運(yùn)行隨機(jī)游走重啟算法,得到網(wǎng)絡(luò)中每個(gè)基因的概率得分,選擇概率得分大于10-5的基因,稱(chēng)為RWR基因;
S4,通過(guò)置換檢驗(yàn)刪除p-value值大于0.1的基因,得到的基因稱(chēng)為候選基因;
S5,在PPI網(wǎng)絡(luò)中選取S4中候選基因之間的相互作用,構(gòu)建一個(gè)局部PPI網(wǎng)絡(luò),表示候選基因間的相互關(guān)系,并改變?cè)摼W(wǎng)絡(luò)的權(quán)重;
S6,在S5中的局部PPI網(wǎng)絡(luò)上搜索Sa中所有基因到Sb中所有基因的最短路徑;
S7,根據(jù)S6的結(jié)果,計(jì)算除種子節(jié)點(diǎn)外每個(gè)節(jié)點(diǎn)的介數(shù)中心性,選擇介數(shù)中心性大于0.01的節(jié)點(diǎn)對(duì)應(yīng)的基因,這些基因稱(chēng)為腫瘤轉(zhuǎn)移關(guān)鍵基因;
S8,對(duì)S7中得到的腫瘤轉(zhuǎn)移關(guān)鍵基因進(jìn)行富集分析及文獻(xiàn)挖掘驗(yàn)證。
2.根據(jù)權(quán)利要求1所述的一種結(jié)合隨機(jī)游走重啟算法和最短路徑的計(jì)算方法,其特征在于,對(duì)于步驟S1,PPI(蛋白質(zhì)-蛋白質(zhì)相互作用)是指兩個(gè)蛋白質(zhì)分子通過(guò)非共價(jià)鍵形成蛋白質(zhì)復(fù)合體的過(guò)程,PPI在細(xì)胞內(nèi)和細(xì)胞間生化過(guò)程中起著重要作用,可用于遺傳疾病的研究,其中蛋白質(zhì)相互作用信息包含了蛋白質(zhì)之間的物理和功能聯(lián)系,可以更廣泛地表達(dá)蛋白質(zhì)之間的關(guān)系,研究證明,PPI中的兩種蛋白更有可能具有類(lèi)似的功能,因此,利用蛋白質(zhì)相互作用信息構(gòu)建PPI網(wǎng)絡(luò)可以檢索與腫瘤轉(zhuǎn)移有關(guān)的關(guān)鍵基因,PPI網(wǎng)絡(luò)中節(jié)點(diǎn)表示蛋白質(zhì),當(dāng)兩個(gè)蛋白質(zhì)之間存在相互作用時(shí),其對(duì)應(yīng)節(jié)點(diǎn)之間存在一條連邊,邊權(quán)表示蛋白質(zhì)之間的置信得分。
3.根據(jù)權(quán)利要求1所述的一種結(jié)合隨機(jī)游走重啟算法和最短路徑的計(jì)算方法,其特征在于,對(duì)于步驟S2,將Sa和Sb中的基因整合并刪去重復(fù)的基因,得到n個(gè)獨(dú)特的基因作為隨機(jī)游走算法的種子節(jié)點(diǎn)。
4.根據(jù)權(quán)利要求1所述的一種結(jié)合隨機(jī)游走重啟算法和最短路徑的計(jì)算方法,其特征在于,對(duì)于步驟S3,隨機(jī)游走重啟算法是一種經(jīng)典的排序算法,它從一些種子節(jié)點(diǎn)開(kāi)始,模擬網(wǎng)絡(luò)中節(jié)點(diǎn)的隨機(jī)游走和重啟,在算法的每一步中,節(jié)點(diǎn)都以相等的概率移動(dòng)到其鄰居節(jié)點(diǎn),并以一定的概率返回種子節(jié)點(diǎn),經(jīng)過(guò)多次迭代后,算法的結(jié)果趨于穩(wěn)定,根據(jù)概率得分對(duì)節(jié)點(diǎn)進(jìn)行排名,隨機(jī)游走重啟算法的迭代公式如下:
Pi+1=(1-r)APi+rP0 (1)
其中P0為初始概率得分列向量,其種子節(jié)點(diǎn)對(duì)應(yīng)的值的設(shè)置為1/n,其它節(jié)點(diǎn)對(duì)應(yīng)值設(shè)置為0,其中Pi表示執(zhí)行第i步后得到的概率得分列向量,A表示PPI網(wǎng)絡(luò)的列歸一化鄰接矩陣,r為重啟概率,以表示種子節(jié)點(diǎn)的重要程度,當(dāng)‖Pi+1-Pi‖L110-6時(shí),迭代結(jié)果趨于穩(wěn)定,算法停止,并且輸出Pi+1,算法的最終結(jié)果表示種子節(jié)點(diǎn)在網(wǎng)絡(luò)中隨機(jī)游走到其他節(jié)點(diǎn)的概率,體現(xiàn)了其他節(jié)點(diǎn)與種子節(jié)點(diǎn)的相關(guān)性,選擇概率得分大于10-5的基因,稱(chēng)為RWR基因。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)石油大學(xué)(華東),未經(jīng)中國(guó)石油大學(xué)(華東)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010004969.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





