[發(fā)明專利]一種基于異質網(wǎng)的基因相似性搜索方法有效
| 申請?zhí)枺?/td> | 201910206801.6 | 申請日: | 2019-03-19 |
| 公開(公告)號: | CN110010196B | 公開(公告)日: | 2020-11-06 |
| 發(fā)明(設計)人: | 杜金蓮;楊開敏;付利華;王丹;趙文兵 | 申請(專利權)人: | 北京工業(yè)大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B50/00 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 劉萍 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 異質網(wǎng) 基因 相似性 搜索 方法 | ||
1.一種基于異質網(wǎng)的基因相似性搜索方法,其特征在于,采用如下步驟:
步驟1、建立基因-疾病-表型異質網(wǎng)、疾病本體有向無環(huán)圖、表型本體有向無環(huán)圖、基因-疾病二分網(wǎng)絡即基因疾病鄰接矩陣Sgd、疾病-表型二分網(wǎng)絡即疾病表型鄰接矩陣Sdp;
通過對獲取到的基因-疾病-表型關聯(lián)數(shù)據(jù)、疾病本體數(shù)據(jù)、表型本體數(shù)據(jù)進行整理和處理,構建基因-疾病-表型異質網(wǎng)、疾病本體有向無環(huán)圖、表型本體有向無環(huán)圖、基因-疾病二分網(wǎng)絡和疾病-表型二分網(wǎng)絡;
步驟2、基于步驟1中構建的疾病本體和表型本體的有向無環(huán)圖,利用一種基于邊的方法分別計算疾病語義相似性矩陣Sdis和表型的語義相似性矩陣Shpo;
步驟3、利用高斯核函數(shù)計算疾病本體的拓撲相似性矩陣Kd和表型本體的拓撲相似性矩陣Kp:
在步驟1構建的基因疾病鄰接矩陣Sgd和疾病表型鄰接矩陣Sdp的基礎上,采用高斯核函數(shù)計算疾病本體的拓撲相似性矩陣Kd和表型本體的拓撲相似性矩陣Kp;
步驟4、分別將疾病和表型的語義相似性矩陣和拓撲相似性矩陣進行融合得到疾病相似性矩陣Sd和表型的相似性矩陣Sp;
將步驟2得到的疾病語義相似性矩陣Sdis和步驟3得到的疾病拓撲相似性矩陣Kd進行融合得到疾病相似性矩陣Sd;將步驟2得到的表型語義相似性矩陣Shpo和步驟3得到的表型拓撲相似性矩陣Kp進行融合得到表型相似性矩陣Sp;
步驟5、利用二部圖算法計算基因-疾病二分網(wǎng)絡中的鏈接權重:
(a)將步驟4得到的疾病相似性矩陣Sd融入基因-疾病二分網(wǎng)絡中,即將基因疾病鄰接矩陣Sgd與疾病相似性矩陣Sd相乘,構建基因疾病整合鄰接矩陣Agd;
(b)先進行疾病到基因的第一次資源擴散,即資源通過基因疾病整合鄰接矩陣Agd從疾病擴散到基因;
(c)再進行基因到疾病的第二次資源擴散,將(b)中第一次資源擴散的結果通過基因疾病整合鄰接矩陣Agd從基因擴散到疾病,并將第二次擴散的結果與步驟1中初始的基因疾病的關聯(lián)關系即基因疾病鄰接矩陣Sgd按比例結合;
通過步驟5得到基因-疾病關聯(lián)矩陣WSgd,該矩陣中的每一個數(shù)值代表基因到疾病的關聯(lián)程度;
步驟6、利用二部圖算法計算疾病-表型二分網(wǎng)絡中鏈接的權重:
(a)將步驟4得到的表型相似性矩陣Sp融入疾病-表型二分網(wǎng)絡中,即將疾病表型鄰接矩陣Sdp與表型相似性矩陣Sp相乘,構建疾病表型的整合鄰接矩陣Adp;
(b)先進行表型到疾病的第一次資源擴散,即資源通過疾病表型整合鄰接矩陣Adp從表型擴散到疾病;
(c)再進行疾病到表型的第二次資源擴散,將(b)中第一次資源擴散的結果通過疾病表型整合鄰接矩陣Adp從疾病擴散到表型,并將第二次擴散的結果與步驟1中初始的疾病表型的關聯(lián)關系即疾病表型鄰接矩陣Sdp按比例結合;
通過步驟6得到疾病-表型關聯(lián)矩陣WSdp,該矩陣中的每一個數(shù)值代表疾病到表型的關聯(lián)程度;
通過前6個步驟形成一個加權的基因-疾病-表型異質網(wǎng);
步驟7、在加權的基因-疾病-表型異質網(wǎng)中,應用PathSim算法計算基因的相似性:
首先計算基因通過基因-疾病-表型-疾病-基因元路徑到每個表型的鏈接權重,即將步驟5中得到的基因-疾病關聯(lián)矩陣WSgd和步驟6得到的疾病-表型關聯(lián)矩陣WSdp相乘得到基因-表型關聯(lián)矩陣WSgp;
其次,根據(jù)基因-表型關聯(lián)矩陣WSgp計算通過基因-疾病-表型-疾病-基因元路徑可達的鏈接權重之和;
最后,利用PathSim算法計算基因間的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業(yè)大學,未經北京工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910206801.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





