[發(fā)明專利]一種基于深度學習的配體化合物快速預篩選方法有效
| 申請?zhí)枺?/td> | 202110697840.8 | 申請日: | 2021-06-23 |
| 公開(公告)號: | CN113393911B | 公開(公告)日: | 2022-08-19 |
| 發(fā)明(設計)人: | 張樹科;靳彥召;王琪;賈慶忠;趙書良;趙金金;陳明 | 申請(專利權(quán))人: | 石家莊鮮虞數(shù)字生物科技有限公司;河北師范大學;河北醫(yī)科大學;河北省藥品醫(yī)療器械檢驗研究院(河北省化妝品檢驗研究中心) |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/64;G16C20/70;G16C20/90;G06N3/04;G06N3/08 |
| 代理公司: | 北京百年育人知識產(chǎn)權(quán)代理有限公司 11968 | 代理人: | 龍鈺 |
| 地址: | 050024 河*** | 國省代碼: | 河北;13 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學習 化合物 快速 篩選 方法 | ||
1.一種基于深度學習的配體化合物快速預篩選方法,其特征在于,包括如下步驟:
S1、通過生成方法生成或已有的小分子庫獲取配體小分子化合物,通過蛋白質(zhì)數(shù)據(jù)庫獲取受體蛋白質(zhì)結(jié)構(gòu),提取受體結(jié)合位點口袋部分氨基酸序列信息,將配體-受體結(jié)構(gòu)進行編碼;
S2、設定對接空間范圍,將配體與受體結(jié)構(gòu)向量通過某種方法結(jié)合起來,輸入到神經(jīng)網(wǎng)絡模型,采用監(jiān)督學習的方式對模型進行訓練,輸出小分子化合物與蛋白質(zhì)親和力評分;
S3、按照親和力評分結(jié)果進行排序,篩選出親和力評分大于設定閾值或者排名前K的陽性化合物,剔除大量陰性化合物;
S4、通過一定的方法獲取陽性化合物的分子指紋;
S5、基于分子指紋利用相似度度量方法對篩選出的陽性化合物進行聚類,采用可增量更新的聚類方法,設定閾值,將相似度不小于設定閾值的化合物歸為一類,即一個簇;
S6、將已經(jīng)聚類完成的簇再進行比較,更新簇和簇中心點,直至聚類簇基本穩(wěn)定,聚類完成后使同一簇內(nèi)的分子結(jié)構(gòu)具有高相似性,不同簇間的分子結(jié)構(gòu)具有低相似性;
S7、分別對不同簇中的小分子化合物按照親和力評分進行排序,取每個簇中評分最高的化合物,作為潛在活性化合物,實現(xiàn)配體化合物的快速預篩選;
S5中所述可增量更新的聚類方法,具體包括:模型每次讀取一個樣本,計算該樣本與當前所有簇中心點的相似度,將其加入到相似度最高的簇中,更新簇和簇中心點,若樣本與現(xiàn)有簇中心點相似度都低于設定閾值,該樣本不屬于任何一簇,將其作為一個新簇中心點,直至所有樣本都聚類完成,更新簇和簇中心點;S6中所述簇之間的比較是基于相似度對不同簇中心點進行比較,對于相似度較高的簇,取出簇中所有樣本,對其進行所述聚類方法聚類;
S8中所述小分子化合物排序是簇內(nèi)進行排序,取每個簇中評分最高的化合物,作為潛在活性化合物,有效去除冗余,保證配體化合物結(jié)構(gòu)的多樣性,提高預測速度及準確性。
2.如權(quán)利要求1所述的基于深度學習的配體化合物快速預篩選模型,其特征在于:S1中所述小分子數(shù)據(jù)庫包括DrugSpaceX數(shù)據(jù)庫、ZINC數(shù)據(jù)庫以及生成模型生成的小分子庫,蛋白質(zhì)數(shù)據(jù)庫包括RCSB PDB數(shù)據(jù)庫及PDBbind數(shù)據(jù)庫,利用Mol2vec或類似算法將配體-受體復合物結(jié)構(gòu)進行編碼。
3.如權(quán)利要求1所述的基于深度學習的配體化合物快速預篩選模型,其特征在于:S2中所述神經(jīng)網(wǎng)絡模型采用深度全連接神經(jīng)網(wǎng)絡和深度卷積神經(jīng)網(wǎng)絡。將樣本數(shù)據(jù)分成獨立的訓練集、驗證集和測試集。構(gòu)建目標函數(shù)E,基于二進制交叉熵損失L,如下式所示:
E(W,b)=L(W,b)+λΩ(W)
其中,yi表示樣本i的標簽,pi表示樣本i預測為陽性的概率,Ω(W)為正則項。
基于訓練樣本集對神經(jīng)網(wǎng)絡模型進行監(jiān)督式訓練,通過梯度下降法迭代更新,得到模型參數(shù):驗證集用來對模型超參數(shù)進行優(yōu)化;測試集用來評價模型的泛化能力。將待篩選的配體和受體結(jié)合向量進行歸一化處理,作為模型輸入,經(jīng)過多層神經(jīng)網(wǎng)絡進行特征提取,最后基于Sigmoid層,輸出小分子化合物與蛋白質(zhì)親和力評分。Sigmoid函數(shù)如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于石家莊鮮虞數(shù)字生物科技有限公司;河北師范大學;河北醫(yī)科大學;河北省藥品醫(yī)療器械檢驗研究院(河北省化妝品檢驗研究中心),未經(jīng)石家莊鮮虞數(shù)字生物科技有限公司;河北師范大學;河北醫(yī)科大學;河北省藥品醫(yī)療器械檢驗研究院(河北省化妝品檢驗研究中心)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110697840.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種樹脂膨脹膠及其制備方法
- 下一篇:一種便于取料的走心機





