[發明專利]一種基于深度學習的配體化合物快速預篩選方法有效
| 申請號: | 202110697840.8 | 申請日: | 2021-06-23 |
| 公開(公告)號: | CN113393911B | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 張樹科;靳彥召;王琪;賈慶忠;趙書良;趙金金;陳明 | 申請(專利權)人: | 石家莊鮮虞數字生物科技有限公司;河北師范大學;河北醫科大學;河北省藥品醫療器械檢驗研究院(河北省化妝品檢驗研究中心) |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/64;G16C20/70;G16C20/90;G06N3/04;G06N3/08 |
| 代理公司: | 北京百年育人知識產權代理有限公司 11968 | 代理人: | 龍鈺 |
| 地址: | 050024 河*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 化合物 快速 篩選 方法 | ||
1.一種基于深度學習的配體化合物快速預篩選方法,其特征在于,包括如下步驟:
S1、通過生成方法生成或已有的小分子庫獲取配體小分子化合物,通過蛋白質數據庫獲取受體蛋白質結構,提取受體結合位點口袋部分氨基酸序列信息,將配體-受體結構進行編碼;
S2、設定對接空間范圍,將配體與受體結構向量通過某種方法結合起來,輸入到神經網絡模型,采用監督學習的方式對模型進行訓練,輸出小分子化合物與蛋白質親和力評分;
S3、按照親和力評分結果進行排序,篩選出親和力評分大于設定閾值或者排名前K的陽性化合物,剔除大量陰性化合物;
S4、通過一定的方法獲取陽性化合物的分子指紋;
S5、基于分子指紋利用相似度度量方法對篩選出的陽性化合物進行聚類,采用可增量更新的聚類方法,設定閾值,將相似度不小于設定閾值的化合物歸為一類,即一個簇;
S6、將已經聚類完成的簇再進行比較,更新簇和簇中心點,直至聚類簇基本穩定,聚類完成后使同一簇內的分子結構具有高相似性,不同簇間的分子結構具有低相似性;
S7、分別對不同簇中的小分子化合物按照親和力評分進行排序,取每個簇中評分最高的化合物,作為潛在活性化合物,實現配體化合物的快速預篩選;
S5中所述可增量更新的聚類方法,具體包括:模型每次讀取一個樣本,計算該樣本與當前所有簇中心點的相似度,將其加入到相似度最高的簇中,更新簇和簇中心點,若樣本與現有簇中心點相似度都低于設定閾值,該樣本不屬于任何一簇,將其作為一個新簇中心點,直至所有樣本都聚類完成,更新簇和簇中心點;S6中所述簇之間的比較是基于相似度對不同簇中心點進行比較,對于相似度較高的簇,取出簇中所有樣本,對其進行所述聚類方法聚類;
S8中所述小分子化合物排序是簇內進行排序,取每個簇中評分最高的化合物,作為潛在活性化合物,有效去除冗余,保證配體化合物結構的多樣性,提高預測速度及準確性。
2.如權利要求1所述的基于深度學習的配體化合物快速預篩選模型,其特征在于:S1中所述小分子數據庫包括DrugSpaceX數據庫、ZINC數據庫以及生成模型生成的小分子庫,蛋白質數據庫包括RCSB PDB數據庫及PDBbind數據庫,利用Mol2vec或類似算法將配體-受體復合物結構進行編碼。
3.如權利要求1所述的基于深度學習的配體化合物快速預篩選模型,其特征在于:S2中所述神經網絡模型采用深度全連接神經網絡和深度卷積神經網絡。將樣本數據分成獨立的訓練集、驗證集和測試集。構建目標函數E,基于二進制交叉熵損失L,如下式所示:
E(W,b)=L(W,b)+λΩ(W)
其中,yi表示樣本i的標簽,pi表示樣本i預測為陽性的概率,Ω(W)為正則項。
基于訓練樣本集對神經網絡模型進行監督式訓練,通過梯度下降法迭代更新,得到模型參數:驗證集用來對模型超參數進行優化;測試集用來評價模型的泛化能力。將待篩選的配體和受體結合向量進行歸一化處理,作為模型輸入,經過多層神經網絡進行特征提取,最后基于Sigmoid層,輸出小分子化合物與蛋白質親和力評分。Sigmoid函數如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于石家莊鮮虞數字生物科技有限公司;河北師范大學;河北醫科大學;河北省藥品醫療器械檢驗研究院(河北省化妝品檢驗研究中心),未經石家莊鮮虞數字生物科技有限公司;河北師范大學;河北醫科大學;河北省藥品醫療器械檢驗研究院(河北省化妝品檢驗研究中心)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110697840.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種樹脂膨脹膠及其制備方法
- 下一篇:一種便于取料的走心機





