[發(fā)明專利]基于網(wǎng)絡(luò)表示學(xué)習(xí)的計(jì)算疾病相似度系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202011035456.3 | 申請(qǐng)日: | 2020-09-27 |
| 公開(公告)號(hào): | CN112151184B | 公開(公告)日: | 2021-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 李洋;汪國華;王柯淇 | 申請(qǐng)(專利權(quán))人: | 東北林業(yè)大學(xué) |
| 主分類號(hào): | G16H50/70 | 分類號(hào): | G16H50/70;G06K9/62 |
| 代理公司: | 哈爾濱市松花江專利商標(biāo)事務(wù)所 23109 | 代理人: | 時(shí)起磊 |
| 地址: | 150040 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 網(wǎng)絡(luò) 表示 學(xué)習(xí) 計(jì)算 疾病 相似 系統(tǒng) | ||
1.基于網(wǎng)絡(luò)表示學(xué)習(xí)的計(jì)算疾病相似度系統(tǒng),其特征在于所述系統(tǒng)包括:
DisGeNet數(shù)據(jù)集、GeneOntlogy數(shù)據(jù)集、HumanNet網(wǎng)絡(luò)、信息融合模塊、網(wǎng)絡(luò)嵌入模塊、疾病相似度計(jì)算模塊;
所述DisGeNet數(shù)據(jù)集用于存儲(chǔ)基因和疾病之間的關(guān)系;
所述GeneOntlogy數(shù)據(jù)集用于存儲(chǔ)Go_term之間的關(guān)系以及Go_term和基因之間的關(guān)系;
所述HumanNet網(wǎng)絡(luò)用于存儲(chǔ)基因之間的關(guān)系;
所述信息融合模塊,用于將基因相似度矩陣進(jìn)行拉普拉斯平滑得到矩陣R,利用矩陣R計(jì)算兩個(gè)Go_term注釋的基因集之間相似度,利用Go_term注釋的基因集之間相似度計(jì)算兩個(gè)Go_term之間的相似度,利用兩個(gè)Go_term之間的相似度獲得基因之間的相似度,其具體過程為:
步驟二一、將HumanNet網(wǎng)絡(luò)中的基因相似度矩陣進(jìn)行拉普拉斯平滑:
其中
其中,R為拉普拉斯平滑后的相似度矩陣,lambda是拉普拉斯平滑的參數(shù),sum是HumanNet中所有基因?qū)ο嗨菩缘目偤停琋是基因的數(shù)量,b是用于將值規(guī)格化為(0,1)區(qū)間的值的擴(kuò)展因子,s[i][j]是i,j的相似度矩陣,gi和gj表示疾病基因;
步驟二二、計(jì)算兩個(gè)Go_term之間的相似度,其具體過程為:
步驟二二一、結(jié)合來自HumanNet和GO_term的信息計(jì)算兩個(gè)GO_term注釋的基因集之間的相似度:
D(t1,t2)是兩個(gè)Go_term注釋的基因集之間的相似度,t1、t2是兩個(gè)GO_term,G1、G2是t1、t2對(duì)應(yīng)的基因集,dij=1-R[i][j]是兩個(gè)基因之間的距離,|g1∪G2|是與t1、t2兩個(gè)GO_term相關(guān)的兩個(gè)基因的集合G1、G2并集的基因數(shù);
步驟二二二、計(jì)算兩個(gè)Go-term之間的相似度:
其中,
h(t1,t2)=D(t1,t2)2*|G|+(1-D(t1,t2)2)*max(|G1|,|G2|)
其中,p是距離t1、t2最近的公共父節(jié)點(diǎn),Gp是p和t1、t2子節(jié)點(diǎn)注釋的基因集,G是根節(jié)點(diǎn)和t1、t2子節(jié)點(diǎn)注釋的基因集,f′(t1,t2,p)是t1、t2、p基于路徑的相似度,h(t1,t2)是t1、t2基于公共父節(jié)點(diǎn)的相似度,是t1注釋的基因集、t2注釋的基因集、t1和t2的共同親本p注釋的基因集三個(gè)基因集并集的基因數(shù)目;
步驟二三、計(jì)算基因之間的相似度:
根據(jù)步驟二二獲得的Go_term之間的相似度,獲得基因之間的相似度:
其中,
其中,S(·,)表示兩個(gè)Go-term之間的相似度,y表示i或j,t1、t2是兩個(gè)GO_term;
基于z-score和給定的GO_term,可以從Tj獲得兩個(gè)集合:
如果|T′th||T′tl|,那么T′j=T′th,否則T′j=T′tl;
其中是相似性標(biāo)準(zhǔn)分?jǐn)?shù),Ti和Tj分別是gi和gj注釋的術(shù)語集,|Ti|+|Tj|是Ti和Tj中基因數(shù)的和,T′j是Tj中部分Go_term的集合,T′i是Ti中部分Go_term語句的集合,所述的注釋的術(shù)語集是與基因相關(guān)的Go_term的集合;
所述網(wǎng)絡(luò)嵌入模塊,基于基因之間的相似度將每個(gè)基因轉(zhuǎn)化為向量形式,其具體過程為:
步驟三一、對(duì)于每條有向邊(i,j)從基因vi到基因vj之間的聯(lián)合概率為:
其中為基因vi的作為起始節(jié)點(diǎn)時(shí)的向量表示,為基因vj作為終止節(jié)點(diǎn)時(shí)的向量表示,T表示向量的轉(zhuǎn)置,其中V是網(wǎng)絡(luò)中頂點(diǎn)的總數(shù);
步驟三二、在網(wǎng)絡(luò)結(jié)構(gòu)中vi、vj的經(jīng)驗(yàn)值定義為:
其中,wij表示GenSim(gi,gj),d′i是vi所有出度的和;
步驟三三、調(diào)整基因的向量表示使p2、之間的差異最小化,即使目標(biāo)函數(shù)
最小化,其中λi為i的權(quán)重,d1(·)表示和p2的相對(duì)熵;
所述疾病相似度計(jì)算模塊,基于基因的向量表示和疾病相關(guān)基因數(shù)據(jù)集DisGeNET將疾病相關(guān)基因融合,得到疾病的向量表示,利用疾病向量表示度量疾病的相似性;
所述Go_term為基因本體的數(shù)據(jù)集;
所述Go_term注釋的基因集是與Go_term相關(guān)基因集的集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北林業(yè)大學(xué),未經(jīng)東北林業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011035456.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





