[發明專利]一種基于無監督域適應的小分子藥物虛擬篩選方法和裝置有效
| 申請號: | 202010855167.1 | 申請日: | 2020-08-24 |
| 公開(公告)號: | CN112086143B | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 吳建盛;梅德進;胡海峰 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/64;G16C20/70;G06K9/62 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 適應 分子 藥物 虛擬 篩選 方法 裝置 | ||
本發明提供一種基于無監督域適應的小分子藥物虛擬篩選方法,根據已知的藥物靶標信息,預測新的藥物靶標信息,進行虛擬篩選;該方法包括構建目標域和源域藥物靶標數據集生成模型;構建訓練無監督域適應的藥物虛擬篩選模型;構建靶向目標域藥物靶標的小分子藥物虛擬篩選模型。在模型構建過程中,能夠有效的解決因樣本數量及信息不足導致的虛擬篩選模型不易構建或者構建不理想的難題。更好地進行虛擬篩選,對于新的藥物靶標和罕見疾病的先導化合物的研究有著重大的幫助。可以實現既能提高篩選的效率又能節省時間和巨額的資金花銷的目的。應用于藥物篩選領域時也能夠滿足藥物靶標配體的生物活性預測的要求。
技術領域
本發明涉及計算機輔助藥物設計,特別涉及一種基于無監督域適應的小分子藥物虛擬篩選方法和裝置。
背景技術
近年來,針對新的藥物靶點或者罕見疾病進行新藥開發已成為近年來的研究熱點。新藥開發需要先通過高通量實驗技術到數量巨大的化合物數據庫中測定靶點與化合物作用的生物活性值,來篩選先導化合物。然而,實驗的方法耗時耗力,更壞的是,往往可得到的化合物數量非常有限,而且并不是所有的藥物靶點都適合于高通量篩選實驗。因此,基于計算的虛擬篩選,它通過模擬目標靶點與候選藥物之間的相互作用,在藥物設計中得到了廣泛的應用,其中基于機器學習的配體虛擬篩選方法是目前最主要的方法。目前的基于機器學習的虛擬篩選方法要想獲得好的性能往往要依賴于大量的訓練樣本。然而,針對新的藥物靶點或者罕見疾病的配體虛擬篩選有時會出現訓練樣本不足甚至缺失的情況,在對它們進行虛擬篩選時往往得不到好的模型。
發明內容
發明目的:本申請的第一目的是提供一種為小樣本下的計算機輔助新藥開發的基于無監督域適應的小分子藥物虛擬篩選方法;本申請的第二目的是提供一種基于無監督域適應的小分子藥物虛擬篩選裝置。
技術方案:為了解決上述問題,本發明提供一種基于無監督域適應的小分子藥物虛擬篩選方法,根據已知的藥物靶標信息,預測新的藥物靶標信息,進行虛擬篩選,該方法包括:
(1)構建目標域和源域藥物靶標數據集生成模型;
(2)構建訓練無監督域適應的藥物虛擬篩選模型;
(3)構建靶向目標域藥物靶標的小分子藥物虛擬篩選模型。
進一步地,所述的目標域和源域藥物靶標數據集的生成,包括:
獲取所需要的初始數據集,其中,所述的初始數據集包括新藥物靶標及其同源藥物靶標的信息,所述信息包括所需要的配體分子smiles和與配體作用的活性值;
根據初始數據集,將藥物靶標所結合的配體的smiles利用分子指紋的方法生成對應的f維分子特征,用0/1來表示;新藥物靶標所結合的配體的分子特征為目標域,其同源的藥物靶標的配體分子特征為源域。
將f維特征作為網絡的輸入,訓練網絡并更新網絡參數。
優選地,所述的無監督域適應模型,包括:
將源域數據輸入進網絡,通過源域的特征得到預測的活性值,域分類網絡判別輸入的特征是來自源域還是目標域,訓練好網絡之后,再輸入進目標域的特征數據,得到預測的活性值,進行虛擬篩選。
在網絡的訓練和網絡參數的更新時,只用到源域數據集的信息和目標域的特征信息,而不用目標域數據集的活性值信息,在測試網絡時,需要目標域數據集的活性值信息E,首先根據如下式I、II所示更新網絡參數:
然后如下式III所示,隨機梯度下降進行優化;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010855167.1/2.html,轉載請聲明來源鉆瓜專利網。





