[發明專利]基于三通道深度學習調控疾病靶點的藥物推薦系統、計算機設備、存儲介質在審
| 申請號: | 202011595896.4 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112652358A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 宋弢;鐘悅;丁卯 | 申請(專利權)人: | 中國石油大學(華東) |
| 主分類號: | G16B15/30 | 分類號: | G16B15/30;G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 通道 深度 學習 調控 疾病 藥物 推薦 系統 計算機 設備 存儲 介質 | ||
本發明公開了一種基于三通道深度學習調控疾病靶點的藥物推薦系統,屬于藥物重定位、三通道深度學習模型預測技術領域。該系統包括三通道深度神經網絡模型,所述的三通道深度神經網絡模型包括特征提取網絡、三通道特征優化網絡和全連接網絡組成的序列處理模型。所述的三通道分別是正樣本藥物分子SMILES序列、負樣本藥物分子SMILES序列和靶點氨基酸序列,將其輸入特征提取網絡進行充分的特征提取后,然后輸入三通道特征優化網絡通過最大化負樣本藥物分子與靶點距離、最小化正樣本藥物分子與靶點距離優化所學特征表示后,將優化后的三個特征向量拼接一起形成拼接向量,將拼接向量和藥物?靶點結合親和力值輸入到全連接網絡中進行回歸分析,最終輸出藥物?靶點結合親和力的預測值。
技術領域
本發明涉及藥物-靶點正負樣本劃分、三通道深度學習模型預測技術領域,特別涉及基于三通道深度學習調控疾病靶點的藥物推薦系統、計算機設備、存儲介質。
背景技術
目前已知疾病4500余種,90%的疾病沒有根治藥物,而面對突發衛生公共事件時,由于缺乏有效藥物,使民眾的生命安全受到威脅,也給國家帶來巨大的經濟損失。目前很少有針對疾病靶點、通過藥物-靶點結合親和力預測來推薦有效藥物的系統。
藥物-靶點相互作用的識別是藥物重定位的關鍵,它可以分為兩類:使用回歸方法預測藥物-靶點的結合親和力(DTA),使用二分類方法預測藥物-靶點相互作用的概率(DTI)。DTA可以將解離常數等藥物-靶點結合信息直接用于結合親和力的預測,因此DTA的預測是目前比較流行的。而在DTI中,需要考慮負樣本信息,目前正負樣本的劃分主要依據化學實驗結果,而Davis數據集以解離常數衡量藥物-靶點的結合親和力,劃分正負樣本的數字標準并不明確。
利用人工智能方法預測藥物-靶點結合親和力有很多成功的案例,在準確率方面,人工智能技術已經超過所有傳統方法。在藥物重定位領域,在原始藥物分子SMILES序列通道和靶點序列通道的基礎上,加入同一藥物的分子指紋通道可以提升模型的準確率。在圖像處理領域,最大化負樣本與目標圖像的距離并最小化正樣本與目標圖像的距離可以有效降低模型誤差,提高模型準確率,而在藥物-靶點結合親和力預測中由于負樣本難以明確并沒有加入負樣本的預測方法或系統出現。
發明內容
本發明實施例提供了一種基于三通道深度學習調控疾病靶點的藥物推薦系統、計算機設備、存儲介質。為了對披露的實施例的一些方面有一個基本的理解,下面給出了簡單的概括。該概括部分不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍。其唯一目的是用簡單的形式呈現一些概念,以此作為后面的詳細說明的序言。
根據本發明實施例的第一方面,提供了基于三通道深度學習調控疾病靶點的藥物推薦系統。
在實施例中,所述系統包括三通道深度神經網絡模型(Three-Tunnel DNN),所述三通道深度神經網絡模型包括特征提取網絡、三通道特征優化網絡和全連接網絡,模型的輸入為藥物分子SMILES序列、負樣本藥物分子SMILES序列、靶點氨基酸序列和藥物-靶點結合親和力值,輸出為藥物-靶點的結合親和力預測值。
可選的,所述的特征提取網絡對藥物分子SMILES序列和靶點氨基酸序列進行充分的特征提取,不斷學習分子結構信息和靶點序列信息,其具體包括多層感知機和卷積神經網絡。所述多層感知機包括嵌入層和四層深度神經網絡組成的藥物分子SMILES序列處理模型,一個輸入是正樣本藥物分子SMILES序列,另一個是負樣本藥物分子SMILES序列。藥物分子序列經嵌入層轉化為分子指紋,將分子指紋輸入到深度神經網絡中學習其特征表示,輸出為藥物分子的特征向量。所述卷積神經網絡包括嵌入層、三個卷積層和一個最大池化層組成的靶點氨基酸序列處理模型,輸入是靶點氨基酸序列。首先,靶點氨基酸序列經標簽編碼和“獨熱”(one-hot)編碼策略轉化為1000×26維靶點二進制矩陣,之后,將二進制矩陣輸入卷積層學習其特征表示,最大池化層用于降維處理,輸出為靶點的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油大學(華東),未經中國石油大學(華東)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011595896.4/2.html,轉載請聲明來源鉆瓜專利網。





