[發(fā)明專利]基于圖表示學(xué)習(xí)的新冠病毒靶標(biāo)預(yù)測和藥物發(fā)現(xiàn)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010725014.5 | 申請(qǐng)日: | 2020-07-24 |
| 公開(公告)號(hào): | CN111916145B | 公開(公告)日: | 2022-03-11 |
| 發(fā)明(設(shè)計(jì))人: | 彭紹亮;周德山;王小奇;徐志建;王力;李肯立;鐘武 | 申請(qǐng)(專利權(quán))人: | 湖南大學(xué) |
| 主分類號(hào): | G16B15/30 | 分類號(hào): | G16B15/30;G16B50/00;G06N3/04;G06N3/08 |
| 代理公司: | 國防科技大學(xué)專利服務(wù)中心 43202 | 代理人: | 王文惠 |
| 地址: | 410012 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 圖表 學(xué)習(xí) 病毒 靶標(biāo) 預(yù)測 藥物 發(fā)現(xiàn) 方法 | ||
1.一種基于圖表示學(xué)習(xí)的新冠病毒靶標(biāo)預(yù)測和藥物發(fā)現(xiàn)方法,其特征在于,包括如下步驟:
第一步、準(zhǔn)備異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)集:構(gòu)造包含藥物、靶標(biāo)、副作用、疾病之間的作用關(guān)系的異構(gòu)關(guān)系網(wǎng)絡(luò),其中藥物-靶標(biāo)相互作用和藥物-藥物相互作用網(wǎng)絡(luò)基于DRUGBANK數(shù)據(jù)庫,靶標(biāo)-靶標(biāo)相互作用網(wǎng)絡(luò)基于HPRD數(shù)據(jù)庫,藥物-疾病關(guān)聯(lián)和靶標(biāo)-疾病關(guān)聯(lián)網(wǎng)絡(luò)基于CTD數(shù)據(jù)庫,藥物-副作用關(guān)聯(lián)網(wǎng)絡(luò)基于SIDER數(shù)據(jù)庫;在構(gòu)造異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)集的過程中,保留相互作用網(wǎng)絡(luò)中共同有的對(duì)象,將處理好的相互作用網(wǎng)絡(luò)視為一個(gè)異構(gòu)網(wǎng)絡(luò),并作為模型的數(shù)據(jù)集;
第二步、對(duì)數(shù)據(jù)集進(jìn)行劃分:
2.1.對(duì)數(shù)據(jù)集中的藥物-靶標(biāo)相互作用網(wǎng)絡(luò)的所有陰性樣本進(jìn)行隨機(jī)抽樣,抽取數(shù)目為陽性數(shù)量的十倍,并把藥物-靶標(biāo)相互作用網(wǎng)絡(luò)中抽樣出來的反例和所有陽性以及其他相互作用網(wǎng)絡(luò)所有正反例組成訓(xùn)練模型的數(shù)據(jù)集,其中,所述陰性樣本的節(jié)點(diǎn)與節(jié)點(diǎn)之間沒有相互作用關(guān)系,而陽性樣本則有;
2.2.將2.1中處理好的數(shù)據(jù)集分為10個(gè)大小相同且互斥的子集,并且每個(gè)子集通過隨機(jī)的分層采樣得到;然后每次把9個(gè)互斥的子集合當(dāng)成訓(xùn)練集合,并在這個(gè)訓(xùn)練集合中隨機(jī)抽取5%作為驗(yàn)證集,剩下的一個(gè)互斥子集作為測試集合,即通過十折交叉驗(yàn)證來訓(xùn)練和測試模型;
2.3.重復(fù)十折交叉驗(yàn)證10次;
第三步、構(gòu)造模型;
3.1.構(gòu)造3層堆疊的神經(jīng)網(wǎng)絡(luò),其中一、二層使用圖卷積神經(jīng)網(wǎng)絡(luò)整合劃分好的數(shù)據(jù)集中復(fù)雜的異構(gòu)關(guān)系網(wǎng)絡(luò)的鄰域信息,給定第l層節(jié)點(diǎn)自身嵌入和節(jié)點(diǎn)鄰居嵌入則下一層節(jié)點(diǎn)的特征表示如下:
其中表示關(guān)系r下節(jié)點(diǎn)i的鄰居集合,ci,r表示節(jié)點(diǎn)i與其邊類型為r的鄰居們之間的邊值總和,s(e)表示節(jié)點(diǎn)i和節(jié)點(diǎn)j之間的邊值,Wr(l)和W(l)表示圖卷積神經(jīng)網(wǎng)絡(luò)中的權(quán)重,σ表示激活函數(shù)ReLU;
3.2.在第三層的神經(jīng)網(wǎng)絡(luò)是由圖卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制組成,即經(jīng)過圖卷積神經(jīng)網(wǎng)絡(luò)處理得到不同關(guān)系類型的鄰域信息總和后,使用注意力機(jī)制反映不同關(guān)系類型的鄰域信息總和對(duì)節(jié)點(diǎn)嵌入的影響程度,其中所述的注意力機(jī)制表示如下:
其中,是節(jié)點(diǎn)i的關(guān)系類型為r的鄰域信息總和,它經(jīng)過相同權(quán)重w和偏置值b的神經(jīng)網(wǎng)絡(luò)處理得到si,r;進(jìn)一步,用softmax函數(shù)處理si,r得到每個(gè)關(guān)系類型的鄰域信息總和的注意力系數(shù)αi,r;最后,將注意力系數(shù)αi,r乘以原來的節(jié)點(diǎn)i的關(guān)系類型為r的鄰域信息總和得到加入了注意力機(jī)制后不同關(guān)系類型的領(lǐng)域信息總和基于圖卷積神經(jīng)網(wǎng)絡(luò),將處理后的領(lǐng)域信息總和乘以不同關(guān)系類型的數(shù)量,再加上節(jié)點(diǎn)上一層嵌入的映射,并經(jīng)過激活函數(shù)的處理后得到最終的節(jié)點(diǎn)嵌入;
3.3.經(jīng)過3.2處理得到了節(jié)點(diǎn)的最終嵌入后,使用網(wǎng)絡(luò)拓?fù)渲亟ǖ姆椒◤?qiáng)制提取關(guān)系異構(gòu)網(wǎng)絡(luò)中的特征表示,得到最終的重定位網(wǎng)絡(luò),其中,網(wǎng)絡(luò)拓?fù)渲亟ǚ绞饺缦拢?/p>
其中Gr,Hr是特定邊緣類型r的投影矩陣,若邊緣類型r是對(duì)稱的,則Gr=Hr;分別通過Gr,Hr對(duì)節(jié)點(diǎn)的特征表示Eu和Ev進(jìn)行邊緣特定投影,并且將兩個(gè)投影得到的向量進(jìn)行內(nèi)積,使這個(gè)內(nèi)積結(jié)果完成原始邊緣值s(e)重建其中,其中,投影矩陣初始化為高斯分布;
第四步、訓(xùn)練模型:將劃分好的數(shù)據(jù)集中的訓(xùn)練集輸入第三步構(gòu)造好的基于圖卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的藥物-靶標(biāo)關(guān)系預(yù)測模型;之后,使用Adam優(yōu)化器計(jì)算出更新的步長,并最小化重建誤差;進(jìn)行10次十折交叉驗(yàn)證,共訓(xùn)練100個(gè)模型,且使用最后一次訓(xùn)練的模型;
第五步、對(duì)新冠病毒進(jìn)行靶標(biāo)預(yù)測和藥物發(fā)現(xiàn)
5.1.選取某個(gè)抑制冠狀病毒的藥物,根據(jù)它在重定位網(wǎng)絡(luò)中和所有靶標(biāo)的關(guān)系作用強(qiáng)度來找出新型冠狀病毒靶標(biāo),這些靶標(biāo)可能是在原網(wǎng)絡(luò)和對(duì)應(yīng)藥物已經(jīng)存在的相互作用關(guān)系的靶標(biāo),也可能是原來和對(duì)應(yīng)藥物沒有相互作用關(guān)系的潛在的靶標(biāo);
5.2.根據(jù)5.1中得到的這些靶標(biāo)在重定位網(wǎng)絡(luò)中和藥物的關(guān)系作用強(qiáng)度,篩選出抑制新型冠狀病毒的藥物;
5.3.通過濕實(shí)驗(yàn)確定了某個(gè)抑制新冠肺炎的藥物后,確定與它關(guān)聯(lián)的那個(gè)靶標(biāo)為新冠肺炎相關(guān)的靶標(biāo)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南大學(xué),未經(jīng)湖南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010725014.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測方法及系統(tǒng)





