[發(fā)明專利]基于機器學(xué)習的自由能微擾網(wǎng)絡(luò)設(shè)計方法在審
| 申請?zhí)枺?/td> | 202011097352.5 | 申請日: | 2020-10-14 |
| 公開(公告)號: | CN112102889A | 公開(公告)日: | 2020-12-18 |
| 發(fā)明(設(shè)計)人: | 李治鵬;溫書豪;楊明俊;林志雄;鄒俊杰;馬健;賴力鵬 | 申請(專利權(quán))人: | 深圳晶泰科技有限公司 |
| 主分類號: | G16C10/00 | 分類號: | G16C10/00;G16C20/50;G16B20/00;G06N3/08;G06N3/04 |
| 代理公司: | 深圳市科吉華烽知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44248 | 代理人: | 胡吉科 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 機器 學(xué)習 自由能 網(wǎng)絡(luò) 設(shè)計 方法 | ||
本發(fā)明公開了基于機器學(xué)習的自由能微擾網(wǎng)絡(luò)設(shè)計方法,包括以下步驟:S1、準備計算所需的小分子數(shù)據(jù)集;S2、準備小分子/蛋白質(zhì)輸入文件;S3、利用FEP計算不同小分子對之間的△△G及std;S4、提取小分子的特征描述符;S5、準備機器學(xué)習模型所需的訓(xùn)練集和測試集;S6、構(gòu)建機器學(xué)習模型;S7、訓(xùn)練機器學(xué)習模型;S8、測試集統(tǒng)計誤差。本發(fā)明能夠處理大量小分子結(jié)合自由能需要計算預(yù)測的場景,能夠快速的設(shè)計出需要的微擾網(wǎng)絡(luò);得到的結(jié)果與std的相關(guān)性更高,進而能夠有效的提高計算精度。并且隨著計算的分子數(shù)量的增加,能夠收集到更多的數(shù)據(jù)用于模型的訓(xùn)練,提高模型的泛化能力和精度。
技術(shù)領(lǐng)域
本發(fā)明屬于分子動力學(xué)模擬技術(shù)領(lǐng)域,具體涉及一種基于機器學(xué)習的自由能微擾網(wǎng)絡(luò)設(shè)計方法。
背景技術(shù)
小分子藥物與靶點蛋白的結(jié)合自由能(△G),對于小分子藥物的設(shè)計有著十分重要的指導(dǎo)作用。自由能微擾方法(free energy perturbation, FEP)作為一種基于分子動力學(xué)(molecular dynamics, MD)的計算方法,能夠?qū)τ诮Y(jié)合自由能進行預(yù)測。當預(yù)測任務(wù)涉及多個小分子時,自由能微擾網(wǎng)絡(luò)的設(shè)計十分必要,能夠有效的提高預(yù)測的精度。設(shè)計的自由能微擾網(wǎng)絡(luò)圖中,每個節(jié)點代表小分子,而每條邊代表兩個小分子之間結(jié)合自由能的差值(△△G)。在網(wǎng)絡(luò)的設(shè)計過程中,核心問題是判斷兩個小分子是否應(yīng)該連接,使得這條邊計算得到的△△G不確定性(std)最小。現(xiàn)有設(shè)計方法大多按照下述原則進行判斷,以確定兩個小分子是否應(yīng)該連接:
(1)基于經(jīng)驗的人工判斷;
(2)基于谷本相似系數(shù)(Tanimoto similarity score)判斷。
現(xiàn)有方法主要存在以下問題
1、基于經(jīng)驗的人工判斷:需要計算的小分子數(shù)目為n時,所有能夠連接的邊總數(shù),即可以進行FEP計算的分子對總數(shù)為n(n-1)/2。隨著小分子數(shù)目的增加,需要進行判斷的邊數(shù)會迅速增加。這種情況下幾乎不可能通過人工的方法進行識別判斷。
2、基于Tanimoto similarity score判斷:使用這一指標時,通常盡量將相似的小分子(Tanimoto similarity score越接近1,兩個小分子越相似)進行連接。相似系數(shù)是基于分子指紋進行計算,考慮的小分子的特征十分有限。同時,按照這種方法判斷得到的相似的分子,并不能保證計算得到的△△G不確定性小。
發(fā)明內(nèi)容
針對上述技術(shù)問題,本發(fā)明的目的在于提供一種基于機器學(xué)習的自由能微擾網(wǎng)絡(luò)設(shè)計方法,利用大量△△G的計算結(jié)果,使用機器學(xué)習的方法訓(xùn)練模型,更加快捷的設(shè)計自由能微擾網(wǎng)絡(luò),提高計算精度。
為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
基于機器學(xué)習的自由能微擾網(wǎng)絡(luò)設(shè)計方法,包括以下步驟:
S1、準備計算所需的小分子數(shù)據(jù)集;
S2、準備小分子/蛋白質(zhì)輸入文件;
S3、利用FEP計算不同小分子對之間的△△G及std;
S4、提取小分子的特征描述符;
S5、準備訓(xùn)練集和測試集;
S6、構(gòu)建機器學(xué)習模型;
S7、訓(xùn)練機器學(xué)習模型;
S8、測試集統(tǒng)計誤差。
具體包括以下步驟:
S1、準備計算所需的小分子數(shù)據(jù)集:準備數(shù)據(jù)集時保證體系的多樣性,以免出現(xiàn)模型對于部分體系的過擬合;
S2、準備小分子/蛋白質(zhì)輸入文件:根據(jù)FEP計算的需求,生成用于FEP計算的初始文件;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳晶泰科技有限公司,未經(jīng)深圳晶泰科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011097352.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種電纜芯手動電動兩用矯直器
- 下一篇:一種電纜芯電動矯直器
- 根據(jù)用戶學(xué)習效果動態(tài)變化下載學(xué)習數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習服務(wù)的方法
- 漸進式學(xué)習管理方法及漸進式學(xué)習系統(tǒng)
- 輔助學(xué)習的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習的自適應(yīng)移動學(xué)習路徑生成方法
- 一種線上視頻學(xué)習系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習方法、裝置及設(shè)備
- 一種學(xué)習方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習效果評測方法及系統(tǒng)





