[發明專利]采用雙隨機游走預測疾病相關代謝物的方法在審
| 申請號: | 201910854180.2 | 申請日: | 2019-09-10 |
| 公開(公告)號: | CN110610765A | 公開(公告)日: | 2019-12-24 |
| 發明(設計)人: | 雷秀娟;帖嬌嬌;趙杰 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G16H50/50 | 分類號: | G16H50/50;G16H50/70;G16H70/00 |
| 代理公司: | 61200 西安通大專利代理有限責任公司 | 代理人: | 朱海臨 |
| 地址: | 710119 陜西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 代謝物 疾病 功能相似性 語義相似性 隨機游走 高斯核 構建 預測 診斷和治療 關系計算 疾病關系 生物實驗 網絡構建 異構網絡 語義信息 高斯 異構 網絡 驗證 試驗 | ||
1.一種采用雙隨機游走預測疾病相關代謝物的方法,其特征在于,包括以下步驟:
(1)將已知的疾病代謝物關系轉化為鄰接矩陣
定義X={m1,m2,…,mT}為代謝物的集合,Y={d1,d2,…,dN}為疾病的集合,T和N分別表示代謝物的總數目和疾病的總數目,用T×N的鄰接矩陣A來表示各代謝物和疾病是否存在已知的關系,如果代謝物mi和疾病dj存在已知關系,則Aij=1,否則Aij=0;
(2)構建疾病相似性網絡
根據MESH數據庫對疾病建立的范疇表,利用兩個疾病之間共同祖先的語義信息來計算疾病之間的語義相似性,用矩陣Sd表示疾病之間的語義相似性;基于代謝物和疾病的拓撲信息,計算疾病之間的高斯核作用譜相似性GSd;將疾病語義相似性Sd和疾病高斯核作用譜相似性GSd進行融合,得到疾病相似性網絡,用矩陣DS表示;
(3)構建代謝物相似性網絡
首先根據疾病之間的相似性,得到單個疾病與一組疾病的相似性;其次,將單一疾病與疾病組的關系擴展到疾病組與疾病組的相似性;最后,通過計算任意兩個代謝物各自相關的疾病組間的相似性之和與各自相關的疾病數目之和的比值得到代謝物的功能相似性,用矩陣Sm表示;基于代謝物和疾病的拓撲信息,計算代謝物之間的高斯核作用譜相似性GSm;將代謝物的功能相似性和代謝物的高斯核作用譜相似性進行融合得到代謝物相似性網絡,用矩陣MS表示;
(4)構建二部異構網絡
將疾病相似性網絡DS、代謝物相似性網絡MS和已知的代謝物-疾病關系網絡A構建為一個二部異構網絡,使用雙隨機游走方法進行預測。
2.根據權利要求1所述的一種采用雙隨機游走預測疾病相關代謝物的方法,其特征在于,步驟(2)中按照公式(1)計算疾病di的有向無環圖中每個疾病術語的語義值:
式中Δ是語義貢獻度因子,t表示疾病di的祖先結點,表示在疾病di的有向無環圖中,每個祖先疾病術語的語義值,按式(2)計算疾病di的語義貢獻值:
式中T(di)為疾病di的祖先結點集合,兩個疾病之間的語義相似度按照式(3)計算:
式中DV(di)和DV(dj)是疾病di和疾病dj的語義貢獻值,T(di)∩T(dj)表示疾病di與疾病dj的共同祖先,使用式(3)計算出所有疾病之間的語義相似性,用一個N×N的矩陣Sd表示疾病語義相似性網絡;
基于疾病和代謝物關系網絡的拓撲信息,按照式(4)計算疾病的高斯核作用譜相似性:
GSd(i,j)=exp(-λm||IP(di)-IP(dj)||2) (4)
式中IP(di)和IP(dj)代表疾病di和dj的相互作用信息,λm是控制核寬的參數,使用公式(5)進行更新;
式中N為疾病的數目,λ′m為1,用一個N×N的矩陣GSd表示疾病高斯核作用譜相似性網絡;
融合疾病語義相似性和疾病高斯核作用譜相似性,按照式(6)構建疾病相似性網絡:
式中GSd表示疾病高斯核作用譜相似性,Sd表示疾病語義相似性,對于最終的疾病相似性網絡使用一個N×N的矩陣DS來表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910854180.2/1.html,轉載請聲明來源鉆瓜專利網。





