[發明專利]一種基于生物子結構預測藥物-靶標相互作用的深度學習方法在審
| 申請號: | 202210207457.4 | 申請日: | 2022-03-03 |
| 公開(公告)號: | CN115312125A | 公開(公告)日: | 2022-11-08 |
| 發明(設計)人: | 劉丹;錢瑩;竇亮 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生物 結構 預測 藥物 靶標 相互作用 深度 學習方法 | ||
1.一種基于生物子結構預測藥物-靶標相互作用的深度學習方法,其特征在于,該方法步驟如下:
步驟a:輸入一個藥物的規范化SMILES序列D和靶標氨基酸序列T;
步驟b:分別對藥物的規范化SMILES序列D和靶標氨基酸序列T進行子結構提取,具體包括:
1)對于藥物的規范化SMILES序列D,使用BCM方法提取藥物的子結構,包括:
1.1)首先從藥物的規范化SMILES序列D提取出藥物的支鏈,根據SMILES的定義規則,即其支鏈使用“()”括起來,提取出支鏈,剩余部分為主鏈;
1.2)然后根據字符串匹配提取出主鏈中常見的子結構;
1.3)最后再依據RECAP的逆合成碎片規則將主鏈進行裂解得到逆合成片段;
1.4)整合所述的支鏈、常見的子結構和逆合成片段,作為規范化SMILES序列D的子結構集合FD;
2)對于靶標氨基酸序列T使用CFM方法提取子結構,CFM方法首先將氨基酸按照化學結構或性質分為8類,通過種類特征映射得到種類序列TC;然后采用不重疊的k-gram序列將TC切割成靶標的功能子結構集合FT;
步驟c:構建協同特征學習模塊,該模塊由輸入表示和特征學習兩部分組成,具體包括:
1)在輸入表示中,分別對藥物的規范化SMILES序列D的子結構集合FD和靶標的功能子結構集合FT進行初始編碼表示,包括:
1.1)對藥物的規范化SMILES序列D的子結構集合FD的表示,首先采用標簽編碼對藥物子結構集合FD進行編碼,獲得藥物的初始表示ID;然后將ID轉化為藥物的嵌入表示ED∈Rmax_drug_frag_length*embed_size,其中max_drug_frag_length表示最大的藥物子結構集合的大小,embed_size表示嵌入維度;
1.2)對靶標的功能子結構集合FT進行表示,先用標簽編碼對靶標子結構集合FT進行編碼,獲得靶標的初始表示IT;然后將IT轉化為其嵌入表示ET∈Rmax_target_frag_length*embed_size,其中max_target_frag_length表示最大的靶標子結構集合的大小,embed_size表示嵌入維度;
2)在特征學習中,分為藥物的特征學習和靶標的特征學習,包括:
2.1)在藥物特征學習中,將ED作為初始輸入,送入卷積神經網絡學習藥物特征,該卷積神經網絡由多個卷積塊和最終的池化層組成,每個卷積塊由卷積層、激活層指數線性單元以及批次歸一化層組成,最后采用池化層進行特征降維,得到最終的藥物表示VD;
2.2)在靶標特征學習中,將ET作為初始輸入,送入卷積神經網絡對靶標特征進行學習,該卷積神經網絡由多個卷積塊和最終的池化層組成,每個卷積塊由卷積層、激活層指數線性單元以及批次歸一化層組成,最后接入池化層,得到最終的靶標表示VT;
步驟d:構建預測器,具體包括:
1)首先拼接步驟c中最終的藥物表示VD和靶標表示VT,得到藥物-靶標的相互作用表示V;
2)然后將V送入多層感知機進行相互作用學習,所述多層感知機是一個全連接網絡,由多個全連接層和最終的sigmoid激活層組成,除最后一層外,每層全連接后接入一個修正線性單元和丟棄層,防止過擬合;最終得到相互作用預測概率,大于0.5則表示預測兩者會發生相互作用,小于0.5則不會。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210207457.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可拆卸的影像科防輻射檢查裝置
- 下一篇:一種乙炔法合成氯乙烯的裝置及方法





