[發(fā)明專利]基于網(wǎng)絡(luò)表示學(xué)習(xí)的計(jì)算疾病相似度系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202011035456.3 | 申請(qǐng)日: | 2020-09-27 |
| 公開(公告)號(hào): | CN112151184B | 公開(公告)日: | 2021-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 李洋;汪國(guó)華;王柯淇 | 申請(qǐng)(專利權(quán))人: | 東北林業(yè)大學(xué) |
| 主分類號(hào): | G16H50/70 | 分類號(hào): | G16H50/70;G06K9/62 |
| 代理公司: | 哈爾濱市松花江專利商標(biāo)事務(wù)所 23109 | 代理人: | 時(shí)起磊 |
| 地址: | 150040 黑龍*** | 國(guó)省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 網(wǎng)絡(luò) 表示 學(xué)習(xí) 計(jì)算 疾病 相似 系統(tǒng) | ||
基于網(wǎng)絡(luò)表示學(xué)習(xí)的計(jì)算疾病相似度系統(tǒng),涉及疾病相似度計(jì)算領(lǐng)域,特別涉及一種基于網(wǎng)絡(luò)表示學(xué)習(xí)的計(jì)算疾病相似度系統(tǒng),包括:信息融合模塊:用于處理提取HumanNet信息、計(jì)算兩個(gè)Go_term之間的相似度,測(cè)量基因之間的相似度;網(wǎng)絡(luò)嵌入模塊:用于將每個(gè)基因轉(zhuǎn)化為向量形式;疾病相似度計(jì)算模塊:基于基因的向量表示和疾病相關(guān)基因數(shù)據(jù)DisGeNET將疾病相關(guān)基因融合,得到疾病的向量表示,利用疾病向量表示度量疾病的相似性;基因與疾病預(yù)測(cè)模塊:實(shí)現(xiàn)基于基因的向量表示,結(jié)合MLP模型,對(duì)基因與疾病之間的關(guān)系進(jìn)行預(yù)測(cè)的功能;本發(fā)明用于提升計(jì)算疾病相似度的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及疾病相似度的計(jì)算領(lǐng)域,特別涉及一種基于網(wǎng)絡(luò)表示學(xué)習(xí)的計(jì)算疾病相似度系統(tǒng)。
背景技術(shù)
近年來(lái)疾病相似度的研究在生物信息領(lǐng)域受到了大量的關(guān)注,隨之出現(xiàn)了很多建立疾病之間相似的方法。建立疾病之間的關(guān)系有助于增進(jìn)對(duì)疾病生物學(xué)的理解,并且,在復(fù)雜疾病發(fā)病原理的理解、診斷、潛在疾病治療藥物的預(yù)測(cè)等任務(wù)中都起到重要作用。而疾病相似度是對(duì)疾病之間關(guān)系的量化過(guò)程,因此計(jì)算疾病的相似度具有重大的生物學(xué)和藥理學(xué)意義。
生活中,各種信息網(wǎng)絡(luò)可能包含大量的節(jié)點(diǎn)和邊,這會(huì)導(dǎo)致直接在網(wǎng)絡(luò)上進(jìn)行計(jì)算是非常困難且緩慢的。因此,人們提出將圖中的節(jié)點(diǎn)表示為可以反映圖信息的低維的向量后再進(jìn)行計(jì)算。這種將圖中節(jié)點(diǎn)表示為向量的過(guò)程就稱為網(wǎng)絡(luò)表示學(xué)習(xí),又叫做網(wǎng)絡(luò)嵌入、圖嵌入。網(wǎng)絡(luò)學(xué)習(xí)表示的目的是根據(jù)網(wǎng)絡(luò)中節(jié)點(diǎn)之間的相互聯(lián)系,將網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)用低維稠密的向量空間表示(其中向量空間的維度遠(yuǎn)小于節(jié)點(diǎn)的總個(gè)數(shù)),并且能夠保持原有網(wǎng)絡(luò)的結(jié)構(gòu)與功能,能夠支持后續(xù)的網(wǎng)絡(luò)處理和分析任務(wù),如節(jié)點(diǎn)分類、節(jié)點(diǎn)聚類、網(wǎng)絡(luò)可視化和鏈路預(yù)測(cè)等。
目前大多從基于本體計(jì)算疾病術(shù)語(yǔ)相似度和基于疾病相關(guān)基因計(jì)算疾病相似度兩個(gè)角度考慮。基于本體計(jì)算疾病術(shù)語(yǔ)相似度是根據(jù)疾病對(duì)信息量最大的共同祖先的信息量來(lái)計(jì)算疾病術(shù)語(yǔ)相似度。目前基于疾病相關(guān)基因計(jì)算疾病相似度有兩種方法,第一種是基于共同的疾病基因(BOG),通過(guò)統(tǒng)計(jì)疾病之間的共同相關(guān)基因個(gè)數(shù)來(lái)獲得疾病的相似度;另一種時(shí)基于過(guò)程相似性計(jì)算基因相似度從而得到疾病相似度。但以上計(jì)算疾病相似度的方法的準(zhǔn)確率都不高。
發(fā)明內(nèi)容
本發(fā)明目的是通過(guò)網(wǎng)絡(luò)表示學(xué)習(xí)的方法解決計(jì)算疾病相似度的準(zhǔn)確率不高的問(wèn)題。
基于網(wǎng)絡(luò)表示學(xué)習(xí)的計(jì)算疾病相似度系統(tǒng),包括:
DisGeNet數(shù)據(jù)集、GeneOntlogy數(shù)據(jù)集、HumanNet網(wǎng)絡(luò)、信息融合模塊、網(wǎng)絡(luò)嵌入模塊、疾病相似度計(jì)算模塊、基因與疾病預(yù)測(cè)模塊;
所述DisGeNet數(shù)據(jù)集用于存儲(chǔ)基因和疾病之間的關(guān)系;
所述GeneOntlogy數(shù)據(jù)集用于存儲(chǔ)Go_term之間的關(guān)系以及Go_term和基因之間的關(guān)系;
所述HumanNet網(wǎng)絡(luò)用于存儲(chǔ)基因之間的關(guān)系;
所述信息融合模塊,用于將基因相似度矩陣進(jìn)行拉普拉斯平滑得到矩陣R,利用矩陣R計(jì)算兩個(gè)Go_term注釋的基因集之間相似度,利用Go_term注釋的基因集之間相似度計(jì)算兩個(gè)Go_term之間的相似度,利用兩個(gè)Go_term之間的相似度獲得基因之間的相似度;
所述網(wǎng)絡(luò)嵌入模塊,基于基因之間的相似度將每個(gè)基因轉(zhuǎn)化為向量形式。
所述疾病相似度計(jì)算模塊,基于基因的向量表示和疾病相關(guān)基因數(shù)據(jù)集DisGeNET將疾病相關(guān)基因融合,得到疾病的向量表示,利用疾病向量表示度量疾病的相似性。
所述基因與疾病預(yù)測(cè)模塊,實(shí)現(xiàn)基于基因的向量表示,結(jié)合MLP模型,對(duì)基因與疾病之間的關(guān)系進(jìn)行預(yù)測(cè)的功能。
所述Go_term為基因本體的數(shù)據(jù)集;
所述Go_term注釋的基因集是與Go_term相關(guān)基因集的集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北林業(yè)大學(xué),未經(jīng)東北林業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011035456.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





