[發明專利]一種基于深度學習的配體化合物快速預篩選方法有效
| 申請號: | 202110697840.8 | 申請日: | 2021-06-23 |
| 公開(公告)號: | CN113393911B | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 張樹科;靳彥召;王琪;賈慶忠;趙書良;趙金金;陳明 | 申請(專利權)人: | 石家莊鮮虞數字生物科技有限公司;河北師范大學;河北醫科大學;河北省藥品醫療器械檢驗研究院(河北省化妝品檢驗研究中心) |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/64;G16C20/70;G16C20/90;G06N3/04;G06N3/08 |
| 代理公司: | 北京百年育人知識產權代理有限公司 11968 | 代理人: | 龍鈺 |
| 地址: | 050024 河*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 化合物 快速 篩選 方法 | ||
本發明提供一種基于深度學習的配體化合物快速預篩選方法。包括如下步驟:S1、構建數據集,將配體化合物與受體蛋白質結合位點的氨基酸序列信息進行編碼;S2、將配體與受體結構向量結合起來,輸入到深度神經網絡,輸出親和力評分,模型采用監督學習的方式進行訓練;S3、按照親和力評分結果進行排序,篩選出陽性化合物,剔除大量陰性化合物;S4、獲取陽性化合物分子指紋,基于相似度或距離度量方法進行聚類;S5、取每個簇中評分最高的化合物,作為潛在活性化合物。本發明實現了配體化合物的快速預篩選,通過對陽性化合物的聚類分析,可以去除冗余,保證配體化合物的結構多樣性,提高預測速度和準確性。
技術領域
本發明屬于計算機應用技術領域,具體涉及一種基于深度學習的配體化合物快速預篩選方法。
背景技術
作為藥物研發的起點,苗頭化合物的發現對整個藥物研發過程至關重要,虛擬篩選作為發現苗頭化合物的一項重要技術,是計算機輔助藥物設計的核心技術,即從大量分子數據庫中快速篩選出少量的目標化合物。先進行配體化合物的預篩選可以提升科研步伐,減少進入生物化學實驗階段的化合物數量,可有效提高藥物研發的成功率和效率。
配體化合物的預篩選最常用的方法是分子對接。通過分子對接可以模擬蛋白質-配體的結合模式,預測配體結合構象,并對親和力進行打分,進而確定潛在活性化合物。然而,現有分子對接理論本身并不完善,分子對接對蛋白-小分子結合模式及親和力預測準確率較低,加上可供選擇的對接程序眾多,并且性能各異,導致在實際使用中的成功率千差萬別。
隨著深度學習的迅猛發展,以及蛋白質晶體結構、小分子活性數據越來越多地積累和開放,將深度學習技術應用到配體化合物的預篩選方法當中,通過真實數據提取信息,可以有效提高藥物篩選命中率、縮短研發周期、降低成本,有較好的發展前景。
發明內容
本發明提出一種基于深度學習的配體化合物快速預篩選方法。其主要解決的問題是建立更有效的配體化合物快速預篩選模型,提高藥物篩選速度,縮短藥物研發流程,降低成本,以實現更高效的藥物篩選。
本發明利用深度學習算法模型從化合物庫中快速篩選出潛在活性化合物,剔除大量陰性樣本,為避免預篩選出的活性化合物在結構上出現冗余的類似化合物,引入聚類思想,對篩選出的陽性化合物進行聚類分析,將結構相似的化合物聚類到一簇,并從每個簇中選擇少量分子。
具體包括以下步驟:
S1、基于小分子數據庫以及生成模型生成的小分子數據集中獲取配體小分子化合物,并將化合物分子進行編碼;
S2、通過蛋白質數據庫獲取受體蛋白質結構,提取受體結合位點(口袋)部分氨基酸序列信息,并將其進行編碼;
S3、設定對接空間范圍,將配體與受體結構向量通過某種方法結合起來,作為神經網絡模型的輸入;
S4、模型為深度神經網絡模型,將樣本數據分成獨立的訓練集、驗證集和測試集;
S5、基于二進制交叉熵損失構建目標函數,目標函數形式為:
E(W,b)=L(W,b)+λΩ(W)
其中,L(W,b)為二進制交叉熵損失,Ω(W)為正則項;
S6、基于訓練樣本集對神經網絡模型進行監督式訓練,通過梯度下降法迭代更新得到模型參數:
S7、通過驗證集對模型超參數進行優化,測試集用來評價模型的泛化能力;
S8、將待篩選的配體和受體結合向量進行歸一化處理,作為模型輸入,經過多層神經網絡進行特征提取,最后基于Sigmoid函數輸出小分子化合物與蛋白質親和力評分;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于石家莊鮮虞數字生物科技有限公司;河北師范大學;河北醫科大學;河北省藥品醫療器械檢驗研究院(河北省化妝品檢驗研究中心),未經石家莊鮮虞數字生物科技有限公司;河北師范大學;河北醫科大學;河北省藥品醫療器械檢驗研究院(河北省化妝品檢驗研究中心)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110697840.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種樹脂膨脹膠及其制備方法
- 下一篇:一種便于取料的走心機





