[發明專利]一種基于圖貝葉斯優化的分子發現方法有效
| 申請號: | 201911327186.0 | 申請日: | 2019-12-20 |
| 公開(公告)號: | CN111063398B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 楊博;崔佳旭;張春旭;孫冰怡 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G16C10/00 | 分類號: | G16C10/00;G16C20/70 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 韓雪梅 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖貝葉斯 優化 分子 發現 方法 | ||
本發明涉及一種基于圖貝葉斯優化的分子發現方法。所述方法包括:獲取候選分子集合;從所述候選分子集合中隨機選取若干個分子進行性質評估,得到分子?性質對集合;根據所述分子?性質對集合對代理模型進行訓練,得到訓練后的代理模型;根據所述訓練后的代理模型對所述候選分子集合中的分子分別進行性質預測,從所述候選集合中選擇希望分子進行性質評估,得到希望分子性質;根據所述希望分子性質找到具有期望性質的分子。本發明基于圖貝葉斯優化的分子發現方法通過對候選集中的分子進行預測,再根據預測結果選擇分子進行評估得到分子的實際性質,有根據的選擇分子進行評估,減少分子的評估次數,從而減小分析評估的代價。
技術領域
本發明涉及分子發現領域,特別是涉及一種基于圖貝葉斯優化的分子發現方法。
背景技術
分子發現一直是計算化學、材料設計等領域中的重要問題。其主要目的是從大量的分子空間中發現具有某一期望性質的分子。在進行分子發現過程中,具有如下特點:(1)分子空間通常十分巨大。例如:潛在的類藥物分子個數約1023-1060。(2)分子空間是離散的。(3)評價一個分子的某項性質(如:類藥物性質、有效性等)通常需要花費高昂代價。例如:應用密度泛函理論(Density?functional?theory)估計分子性質,高精度的估計是在基于高昂的計算量得到的,或者通過臨床試驗來評價一個分子的有效性,這可能導致一些致命的危害。
目前分子發現方法主要有進化算法、模擬退火、進化策略、混合方法等。然而這些方法需要大量的評估來維護種群多樣性,是直接在評估代價高昂的空間搜索的,從而導致分子發現的代價較高。另一種最新的分子發現技術是首先把所有分子編碼到向量空間中,然后在向量空間進行優化(如使用貝葉斯優化),最后通過把得到的向量解碼回分子。然而這一做法即使在向量空間搜索時考慮代價,其在訓練編碼-解碼工具(如變分自編碼器)時,為保證編碼-解碼的準確性,仍然需要花費大量額外的預訓練時間,最終還是無法降低分子發現的代價。
發明內容
本發明的目的是提供一種基于圖貝葉斯優化的分子發現方法,降低分子發現的代價。
為實現上述目的,本發明提供了如下方案:
一種基于圖貝葉斯優化的分子發現方法,所述方法包括:
獲取候選分子集合;所述候選分子集合包括若干個分子;
從所述候選分子集合中隨機選取若干個分子進行性質評估,得到分子-性質對集合;
根據所述分子-性質對集合對代理模型進行訓練,得到訓練后的代理模型;所述代理模型用于對分子的性質進行預測;
根據所述訓練后的代理模型對所述候選分子集合中的分子分別進行性質預測,得到所述候選分子集合中的各分子的預測性質;
根據所述候選分子集合中的各分子的預測性質從所述候選集合中選擇希望分子進行性質評估,得到希望分子性質;
根據所述希望分子性質找到具有期望性質的分子。
可選的,所述候選分子集合采用隨機圖生成方法、進化方法、深度圖生成模型方法或人工給定方法生成。
可選的,對隨機選取的若干個分子進行性質評估的過程為并行評估。
可選的,所述根據所述分子-性質對集合對代理模型進行訓練,得到訓練后的代理模型具體包括:
根據所述分子-性質對集合對神經網絡權重進行訓練,得到訓練后的神經網絡權重;
根據所述分子-性質對集合對貝葉斯線性回歸中的超參數進行訓練,得到訓練后的貝葉斯線性回歸中的超參數;
根據所述訓練后的神經網絡權重和所述訓練后的貝葉斯線性回歸中的超參數得到訓練后的代理模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911327186.0/2.html,轉載請聲明來源鉆瓜專利網。





