[發(fā)明專利]基于三通道深度學(xué)習(xí)調(diào)控疾病靶點(diǎn)的藥物推薦系統(tǒng)、計(jì)算機(jī)設(shè)備、存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011595896.4 | 申請(qǐng)日: | 2020-12-29 |
| 公開(公告)號(hào): | CN112652358A | 公開(公告)日: | 2021-04-13 |
| 發(fā)明(設(shè)計(jì))人: | 宋弢;鐘悅;丁卯 | 申請(qǐng)(專利權(quán))人: | 中國石油大學(xué)(華東) |
| 主分類號(hào): | G16B15/30 | 分類號(hào): | G16B15/30;G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 通道 深度 學(xué)習(xí) 調(diào)控 疾病 藥物 推薦 系統(tǒng) 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種基于三通道深度學(xué)習(xí)方法調(diào)控疾病靶點(diǎn)的藥物推薦系統(tǒng),屬于藥物重定位、三通道深度學(xué)習(xí)模型預(yù)測(cè)技術(shù)領(lǐng)域。該系統(tǒng)包括三通道深度神經(jīng)網(wǎng)絡(luò)模型,所述的三通道深度神經(jīng)網(wǎng)絡(luò)模型包括特征提取網(wǎng)絡(luò)、三通道特征優(yōu)化網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)組成的序列處理模型。所述的特征提取網(wǎng)絡(luò)包括用于藥物分子(包括正樣本和負(fù)樣本藥物分子)特征提取的多層感知機(jī)和用于靶點(diǎn)氨基酸序列特征提取的卷積神經(jīng)網(wǎng)絡(luò)。所述的三通道優(yōu)化網(wǎng)絡(luò)通過最大化負(fù)樣本藥物分子與靶點(diǎn)距離、最小化正樣本藥物分子與靶點(diǎn)距離優(yōu)化所學(xué)特征表示后,將優(yōu)化后的三個(gè)特征向量拼接一起形成拼接向量。所述的全連接網(wǎng)絡(luò)對(duì)拼接向量和藥物-靶點(diǎn)結(jié)合親和力值進(jìn)行回歸分析,最終輸出藥物-靶點(diǎn)結(jié)合親和力的預(yù)測(cè)值。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述的特征提取網(wǎng)絡(luò)對(duì)藥物分子SMILES序列和靶點(diǎn)氨基酸序列特征進(jìn)行充分提取,其具體包括:多層感知機(jī)和卷積神經(jīng)網(wǎng)絡(luò)。所述多層感知機(jī)包括嵌入層和四層深度神經(jīng)網(wǎng)絡(luò)組成的藥物分子SMILES序列處理模型,一個(gè)輸入是正樣本藥物分子SMILES序列,另一個(gè)是負(fù)樣本藥物分子SMILES序列,藥物分子序列經(jīng)嵌入層轉(zhuǎn)化為分子指紋,將分子指紋輸入到深度神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)其特征表示,輸出為藥物分子的特征向量。所述卷積神經(jīng)網(wǎng)絡(luò)包括嵌入層、三個(gè)卷積層和一個(gè)最大池化層組成的靶點(diǎn)氨基酸序列處理模型,輸入是靶點(diǎn)氨基酸序列,首先,靶點(diǎn)氨基酸序列經(jīng)標(biāo)簽編碼和“獨(dú)熱”(one-hot)編碼策略轉(zhuǎn)化為1000×26維靶點(diǎn)二進(jìn)制矩陣,之后,將二進(jìn)制矩陣輸入到卷積層和最大池化層學(xué)習(xí)其特征表示并進(jìn)行降維處理,輸出為靶點(diǎn)的特征向量。
3.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述的三通道優(yōu)化網(wǎng)絡(luò)對(duì)特征提取網(wǎng)絡(luò)得到的藥物分子正樣本、負(fù)樣本和靶點(diǎn)特征向量進(jìn)一步優(yōu)化,其具體包括Triplet Loss方法。所述Triplet Loss方法通過最大化藥物分子負(fù)樣本與靶點(diǎn)的距離、最小化藥物分子正樣本與靶點(diǎn)的距離,進(jìn)一步優(yōu)化特征提取網(wǎng)絡(luò)得到的三類特征向量,并將三類向量拼接一起形成拼接向量,輸出為拼接向量。
4.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述的全連接網(wǎng)絡(luò)對(duì)拼接向量進(jìn)行非線性處理,并預(yù)測(cè)藥物-靶點(diǎn)結(jié)合親和力,其具體包括三個(gè)全連接層和兩個(gè)dropout層,輸入為拼接向量和藥物-靶點(diǎn)結(jié)合親和力值,將其輸入全連接層和dropout層進(jìn)行非線性處理并防止模型過擬合,輸出為藥物-靶點(diǎn)的結(jié)合親和力預(yù)測(cè)值。
5.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器,顯卡,中央處理器,以及存儲(chǔ)在所述存儲(chǔ)器上的可被所述中央處理器以及顯卡并行處理的可執(zhí)行程序,其特征在于,所述中央處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)以下步驟:構(gòu)建三通道深度神經(jīng)網(wǎng)絡(luò)模型,所述的三通道深度神經(jīng)網(wǎng)絡(luò)包括:特征提取網(wǎng)絡(luò)、三通道特征優(yōu)化網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)。
6.如權(quán)利要求5所述的計(jì)算機(jī)設(shè)備:特征提取網(wǎng)絡(luò),其特征在于,將藥物分子的SMILES序列轉(zhuǎn)化為1024維分子指紋后輸入到多層感知機(jī)中提取其特征表示向量;將靶點(diǎn)氨基酸序列的每個(gè)不重復(fù)字符分配一個(gè)唯一且固定的數(shù)字標(biāo)識(shí)符,采用標(biāo)簽編碼方式將序列轉(zhuǎn)化為一維數(shù)字向量,采用獨(dú)熱(one-hot)編碼策略將一維數(shù)字向量轉(zhuǎn)化為二進(jìn)制矩陣,將二進(jìn)制矩陣輸入卷積神經(jīng)網(wǎng)絡(luò)中提取其特征表示向量。
7.如權(quán)利要求5所述的計(jì)算機(jī)設(shè)備:三通道特征優(yōu)化網(wǎng)絡(luò),其特征在于,最大化負(fù)樣本藥物分子與靶點(diǎn)的距離,最小化正樣本藥物分子與靶點(diǎn)的距離,并將優(yōu)化后的特征向量拼接一起形成拼接向量。
8.如權(quán)利要求5所述的計(jì)算機(jī)設(shè)備:全連接網(wǎng)絡(luò),其特征在于,對(duì)拼接向量和來自擴(kuò)展Davis數(shù)據(jù)集的結(jié)合親和力值進(jìn)行回歸分析,得到藥物-靶點(diǎn)結(jié)合親和力預(yù)測(cè)值。
9.一種存儲(chǔ)介質(zhì),其存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,當(dāng)所述計(jì)算機(jī)程序被中央處理器執(zhí)行時(shí)實(shí)現(xiàn)以下步驟:構(gòu)建三通道深度神經(jīng)網(wǎng)絡(luò)模型,所述的三通道深度神經(jīng)網(wǎng)絡(luò)包括:特征提取網(wǎng)絡(luò)、三通道特征優(yōu)化網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)。首先使用特征提取網(wǎng)絡(luò)對(duì)藥物分子的正樣本、負(fù)樣本和靶點(diǎn)信息進(jìn)行充分的提取;其次,將提取到的三類信息利用三通道特征優(yōu)化網(wǎng)絡(luò)最大化負(fù)樣本藥物分子與靶點(diǎn)距離,最小化正樣本與靶點(diǎn)距離,并將優(yōu)化后的特征表示拼接一起形成拼接向量;之后,將拼接向量輸入全連接網(wǎng)絡(luò)中進(jìn)行回歸分析,得到藥物-靶點(diǎn)結(jié)合親和力預(yù)測(cè)值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國石油大學(xué)(華東),未經(jīng)中國石油大學(xué)(華東)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011595896.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





