[發明專利]一種基于評分器和動態圖網絡的分子對接方法在審
| 申請號: | 202210226317.1 | 申請日: | 2022-03-09 |
| 公開(公告)號: | CN114758725A | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 鄧岳;郭弢 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B15/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 姜海榮;肖莎 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 評分 動態 網絡 分子 對接 方法 | ||
本發明公開了一種基于評分器和動態圖網絡的分子對接方法,包括以下步驟:構建預測器的圖神經網絡,即定義節點特征及邊特征;對上述構建的預測器的圖神經網絡進行更新;基于預測器對親和力進行預測;構建及訓練預測器的損失函數;構建生成器,對數似然函數進行定義;基于生成器對數似然函數的梯度進行預測;對生成器進行訓練,基于朗之萬采樣進行構象優化;基于預測器及生成器,完成分子對接。利用圖神經網絡實現小分子與蛋白質的對接,利用動態構建圖神經網絡進行蛋白質和小分子的表征學習,利用圖神經網絡訓練好一個判別器,能夠捕獲蛋白質和小分子的相互作用,并對親和力進行預測,有利于發現親和力更高的對接構象。
技術領域
本發明涉及分子對接技術領域,更具體的說是涉及一種基于評分器和動態圖網絡的分子對接方法。
背景技術
目前,已有的機器學習多集中于預測式模型的研究上,對生成式模型的研究相對不足。在實際問題中,往往需要利用機器學習去生成新的樣本。如何能夠有效地對數據集數據分布進行建模并生成出可靠的樣本,需要對生成式模型有更多的研究。最常用的生成式模型(生成對抗網絡和變分自編碼器)都有各自的不足。生成對抗網絡的度量是靠數據驅動學習而得,類似黑箱系統可解釋性不高,且具有訓練難度大的特點;變分自編碼器只能近似似然函數的下界,不能準確估計似然函數和下界之間的間隙,所以生成的質量欠佳。
當下主流的分子對接軟件應用的是非深度學習方法,應用源自經驗的分子力場對分子構象進行親和力計算,可靠性不高;應用蒙特卡羅方法對分子構象進行搜索,對計算機算力要求較高,搜索速度較慢。當對大量分子數據集進行虛擬篩選時,速度成為了此方法的最大限制。
目前的蛋白質和小分子表征學習,主要是對對接區域進行三維網格構建,對網格賦予不同的特征,再用三維卷積網絡對三維網格進行表征學習。如此操作,計算量會十分巨大,而且三維網格的冗余也會導致很多無謂的計算。
因此,有效縮短分子對接構象生成的時間,充分考慮有效距離內的原子相互作用,發現親和力更高的對接構象是本領域技術人員亟需解決的問題。
發明內容
有鑒于此,本發明提供了一種基于評分器和動態圖網絡的分子對接方法,利用圖神經網絡實現小分子與蛋白質的對接,利用動態構建圖神經網絡進行蛋白質和小分子的表征學習,在節省算力的情況下有效地對數據集中的對接構象進行學習,充分考慮有效距離內的原子相互作用,利用圖神經網絡訓練好一個判別器,能夠捕獲蛋白質和小分子的相互作用,并對親和力進行預測,有利于發現親和力更高的對接構象。
為了實現上述目的,本發明采用如下技術方案:
一種基于評分器和動態圖網絡的分子對接方法,包括以下步驟:
S1、構建預測器的圖神經網絡,即定義節點特征及邊特征;
S2、對上述構建的預測器的圖神經網絡進行更新;
S3、基于預測器對親和力進行預測;
S4、構建及訓練預測器的損失函數;
S5、構建生成器,對數似然函數進行定義;
S6、基于生成器對數似然函數的梯度進行預測;
S7、對生成器進行訓練,基于朗之萬采用進行構象優化;
S8、基于預測器及生成器,完成分子對接。
優選的,所述步驟S1具體包括:
S11、對配體原子和口袋原子的特征進行編碼,編碼形式為:
vi=(ai,ci,hi)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210226317.1/2.html,轉載請聲明來源鉆瓜專利網。





