[發明專利]基于遺傳算法集成深度學習網絡的藥物推薦系統、計算機設備、存儲介質在審
| 申請號: | 202110752111.8 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113488102A | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 宋弢;鐘悅;田慶雨 | 申請(專利權)人: | 中國石油大學(華東) |
| 主分類號: | G16B15/30 | 分類號: | G16B15/30;G16C20/50;G16H50/70;G16H70/40;G06N3/04;G06N3/08;G06N3/12 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遺傳 算法 集成 深度 學習 網絡 藥物 推薦 系統 計算機 設備 存儲 介質 | ||
本發明公開了一種基于遺傳算法集成深度學習網絡的藥物推薦系統,屬于藥物重定位、深度學習、集成學習模型預測技術領域。該系統包括基于遺傳算法集成深度學習網絡,所述的基于遺傳算法集成深度學習網絡包括特征提取網絡、遺傳算法優化權重和全連接網絡組成的序列處理模型。所述的基于遺傳算法集成深度學習網絡將藥物分子SMILES序列和靶點蛋白FASTA序列輸入特征提取網絡進行充分的特征提取以獲得特征向量,使用遺傳算法為多個特征向量分配權重,將特征向量乘以各自權重后將其“拼接”一起形成拼接向量,將拼接向量和藥物?靶點結合親和力真實值輸入到全連接網絡中進行回歸分析,輸出藥物?靶點結合親和力預測值,將預測值排序,最終得到集成多種特征表示方式的針對特定靶點的藥物分子推薦列表。
技術領域
本發明涉及遺傳算法、深度學習模型預測技術領域,特別涉及基于遺傳算法集成深度學習網絡的藥物推薦系統、計算機設備、存儲介質。
背景技術
藥物-靶點結合親和力的預測是藥物重定位的關鍵,將藥物分子序列、靶點蛋白氨基酸序列和藥物-靶點結合親和力值輸入到深度學習網絡中訓練,利用訓練好的網絡預測未知的藥物-靶點結合親和力值已經成為目前預測準確率最高的方法之一。
但是,每個深度學習模型的預測結果各不相同,不同的深度學習模型預測結果重合率較低,在選擇藥物分子進行生物實驗驗證時仍然面臨過多的選擇,有較高的失敗率。因此,將多個深度學習網絡進行集成,考慮不同網絡對最終預測結果的影響,是解決這一現狀的方法之一。
發明內容
本發明實施例提供了一種基于遺傳算法集成深度學習網絡的藥物推薦系統、計算機設備、存儲介質。為了對披露的實施例的一些方面有一個基本的理解,下面給出了簡單的概括。該概括部分不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍。其唯一目的是用簡單的形式呈現一些概念,以此作為后面的詳細說明的序言。
根據本發明實施例的第一方面,提供了基于遺傳算法集成深度學習網絡的藥物推薦系統。
在實施例中,所述系統包括基于遺傳算法集成深度學習網絡,所述基于遺傳算法集成深度學習網絡模型包括特征提取網絡、遺傳算法優化權重和全連接網絡,模型的輸入為藥物分子SMILES序列和靶點蛋白氨基酸序列,輸出為藥物-靶點的結合親和力預測值。
可選的,所述的特征提取網絡對藥物分子SMILES序列和靶點蛋白氨基酸序列進行充分的特征提取,不斷學習分子結構信息和靶點序列信息,其具體包括卷積神經網絡和多層感知機。所述卷積神經網絡用于提取藥物分子和靶點蛋白序列信息,包括嵌入層、三個卷積層和一個最大池化層,輸入是藥物分子序列、靶點蛋白序列。首先,藥物分子序列、靶點蛋白序列經嵌入層的標簽編碼和“獨熱”(one-hot)編碼轉化為二進制矩陣,之后,將矩陣輸入卷積層學習其特征表示,最大池化層用于降維處理,輸出為藥物分子、靶點蛋白的特征向量。所述多層感知機用于處理藥物分子序列信息,包括嵌入層和四層深度神經網絡,藥物分子序列經嵌入層轉化為分子指紋,將分子指紋輸入到深度神經網絡中學習其特征表示,輸出為藥物分子的特征向量。
可選的,所述的遺傳算法優化權重為每個深度學習網絡得到的特征向量分配權重,并將乘以各自權重的特征向量“拼接”一起,其具體包括遺傳算法。所述遺傳算法用于優化特征向量的權重,使得特征向量乘以各自的權重后,以最優比例考慮不同因素對結果的影響,預測更準確。
可選的,所述的全連接網絡對拼接向量進行非線性處理,并進行藥物-靶點結合親和力的預測,其具體包括全連接層。所述全連接層將拼接向量輸入三個dropout率為0.1的全連接層進行非線性處理,dropout用于防止模型過擬合,輸出為藥物-靶點的結合親和力預測值。
可選的,所述系統的輸入為藥物分子SMILES序列和靶點蛋白序列。
可選的,對所述的基于遺傳算法集成深度學習網絡利用Davis數據集進行訓練,并獲得了完善的模型參數。
根據本發明實施的第二方面,提供一種計算機設備。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油大學(華東),未經中國石油大學(華東)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110752111.8/2.html,轉載請聲明來源鉆瓜專利網。





