[發(fā)明專利]基于深度學習調控疾病靶點的中藥分子推薦系統(tǒng)、計算機設備、存儲介質在審
| 申請?zhí)枺?/td> | 202011431510.6 | 申請日: | 2020-12-09 |
| 公開(公告)號: | CN112562790A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設計)人: | 宋弢;鐘悅;丁卯;田慶雨;杜珍珍;劉嘉麗 | 申請(專利權)人: | 中國石油大學(華東) |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B30/10;G16B15/30;G06N3/08;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 調控 疾病 中藥 分子 推薦 系統(tǒng) 計算機 設備 存儲 介質 | ||
1.一種基于深度學習方法調控疾病靶點的藥物分子推薦系統(tǒng),屬于藥物重定位、卷積神經網絡、殘差網絡技術領域。該系統(tǒng)包括深度殘差網絡模型(DNN_Res),所述的深度殘差網絡模型包括嵌入網絡、卷積殘差神經網絡(CNN_Res)和全連接層殘差網絡(Dense_Res)。
所述的嵌入網絡將藥物分子SMILES序列或蛋白質氨基酸序列轉化為二進制矩陣。所述的卷積殘差神經網絡包括三個卷積層、一個加法層和一個最大池化層,是一個“學習”藥物分子SMILES序列或蛋白質氨基酸序列特征表示的網絡,網絡的輸入是表示藥物分子或蛋白質的二進制矩陣,輸出是藥物分子或蛋白質的特征表示向量。所述的全連接層殘差網絡包括三個全連接層、兩個dropout層和一個加法層,輸入是藥物分子和蛋白質特征表示的拼接向量以及二者的實際結合親和力值,輸出是該藥物分子與蛋白質的結合親和力預測值。
2.如權利要求1所述的系統(tǒng),其特征在于,所述的嵌入網絡將藥物分子的SMILES序列或者蛋白質氨基酸序列的每個不重復字符分配一個唯一且固定的數字標識符,將序列轉化為一維數字向量,之后采用獨熱(one-hot)編碼策略,將一維數字向量轉化為二進制矩陣,使用這一矩陣代表輸入的藥物分子或蛋白質。其特征在于,所述嵌入網絡的輸入為來自KIBA數據集的藥物分子SMILES序列、蛋白質氨基酸序列。
3.如權利要求1所述的系統(tǒng),其特征在于,所述的卷積殘差神經網絡對藥物分子或蛋白質二進制矩陣進行充分的特征提取,不斷學習序列的信息,其具體包括:首先將經過三個卷積層的序列信息與僅經過一個卷積層的序列信息通過加法層相加,再將其輸入最大池化層進行降維操作,最終獲得128維向量表示藥物分子或蛋白質的特征向量。其特征在于,所述卷積殘差神經網絡的輸入為藥物分子或蛋白質的二進制矩陣。
4.如權利要求1所述的系統(tǒng),其特征在于,所述的全連接層殘差網絡對藥物-靶點的結合親和力值進行預測,不斷提高模型的準確率,降低模型的誤差,其具體包括:首先將、藥物分子和蛋白質特征表示向量拼接一起得到拼接向量,將拼接向量與藥物-靶點結合親和力值共同輸入模型中,經過全連接層的非線性化處理和dropout層隨機隱藏神經元以防止過擬合操作,最終得到藥物-靶點結合親和力預測值。通過比較預測值與真實值之間的關系得到模型準確率,通過計算預測值與真實值的均方誤差得到模型的損失值,通過減小損失值不斷調整模型參數以得到最優(yōu)訓練模型。其特征在于,所述全連接層殘差網絡的輸入為來自KIBA數據集的藥物-靶點結合親和力值和卷積殘差神經網絡得到的藥物分子與蛋白質特征表示的拼接向量。
5.一種計算機設備,包括存儲器,顯卡,中央處理器,以及存儲在所述存儲器上的可被所述中央處理器以及顯卡并行處理的可執(zhí)行程序,其特征在于,所述中央處理器執(zhí)行所述程序時實現(xiàn)以下步驟:構建深度殘差神經網絡模型,所述的深度殘差神經網絡模型包括嵌入網絡、卷積殘差神經網絡和全連接層殘差網絡。
6.如權利要求5所述的計算機設備:嵌入網絡,其特征在于,將藥物分子的SMILES序列或蛋白質氨基酸序列的每個不重復字符分配一個唯一且固定的數字標識符,將序列轉化為一維數字向量,采用獨熱(one-hot)編碼策略,將一維數字向量轉化為二進制矩陣,使用這一矩陣代表輸入的藥物分子或蛋白質。
7.如權利要求5所述的計算機設備:卷積殘差神經網絡,其包括三個卷積層、一個加法層和一個最大池化層,是一個以卷積神經網絡為基礎實現(xiàn)加入殘差功能的神經網絡。模型的輸入為KIBA數據集中的藥物分子SMILES序列或蛋白質氨基酸序列,最終輸出為藥物分子或蛋白質的特征向量。其特征在于,將經過三個卷積層的序列信息與僅經過一個卷積層的序列信息通過加法層相加,再將其輸入最大池化層進行降維操作,最終獲得128維向量表示藥物分子或蛋白質的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油大學(華東),未經中國石油大學(華東)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011431510.6/1.html,轉載請聲明來源鉆瓜專利網。





