[發明專利]一種基于流模型的抗體序列結構協同設計方法在審
| 申請號: | 202210001847.6 | 申請日: | 2022-01-04 |
| 公開(公告)號: | CN114360636A | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 鄧岳;郭弢 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B30/10;G16B40/00;G16B50/00 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 符繼超 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模型 抗體 序列 結構 協同 設計 方法 | ||
本發明公開了一種基于流模型的抗體序列結構協同設計方法,包括以下步驟:S1、選取結構抗體數據集作為通用的抗體數據;S2、獲取氨基酸序列信息及結構信息;S3、將序列信息及結構信息編碼入圖神經網絡,對神經網絡進行更新,得到氨基酸編碼;S4、將氨基酸編碼輸入至第一流模型中進行變換,得到氨基酸類型,將預測到的氨基酸類型輸入圖神經網絡,對其進行更新,得到新的氨基酸編碼;S5、將新的氨基酸編碼輸入至第二流模型中進行變換,得到氨基酸的三維坐標信息;S6、將氨基酸類型及三維坐標信息與真實值做損失函數,最小化損失函數,優化生成模型參數。
技術領域
本發明涉及抗體序列結構預測技術領域,更具體的說是涉及一種基于流模型的抗體序列結構協同設計方法。
背景技術
目前,傳統的機器學習方法是針對一個特定的,一般是有大量數據的數據集,試圖學習出一個預測式模型或生成式模型,使得模型能夠建模出數據集中的概率分布,從而得到準確的預測或是生成出符合數據集特征的樣本。一種常用于生成式模型的方法,通過可逆、可微、連續的非線性變換,將具有復雜分布的數據集樣本映射到具有簡單分布的隱空間中,從而使得模型更好地對數據集中的概率分布進行建模。可變區是抗體結合抗原的位置,其氨基酸的組成和排列決定抗體的抗原結合特異性。可變區存在一些氨基酸能夠高頻變化組合的區域,這些區域被稱為互補決定區(complementarity determining region,CDR區),CDR區決定了抗體的獨特型(抗獨特型抗體表達)。抗體設計就主要針對CDR區的氨基酸序列。進行設計。
但是,已有的機器學習多集中于預測式模型的研究上,對生成式模型的研究相對不足。在實際問題中,往往需要利用機器學習去生成新的樣本。如何能夠有效地對數據集數據分布進行建模并生成出可靠的樣本,需要對生成式模型有更多的研究。最常用的生成式模型(生成對抗網絡和變分自編碼器)都有各自的不足。生成對抗網絡的度量是靠數據驅動學習而得,類似黑箱系統可解釋性不高,且具有訓練難度大的特點;流模型處于新興發展階段,目前的應用局限于計算機視覺任務(人臉圖像生成等),在實際場景中的應用還比較缺乏;目前的機器學習蛋白質設計方法主要分為兩種:序列設計和基于結構的序列設計。序列設計考慮了數據集中蛋白質的氨基酸序列卻未考慮蛋白質結構,類似于自然語言處理的方式直接對序列進行生成,缺乏對蛋白質結構信息的利用。基于結構的序列設計是以蛋白質的結構為輸入條件,對氨基酸序列進行生成,此方法能夠在一定程度上利用蛋白質結構信息,卻難以生成出新的結構。此外,抗體設計與蛋白質設計略有不同,抗體設計生成的是CDR區的氨基酸序列,保持骨架區(Framework Region,FR區)的恒定,目前缺乏針對抗體的機器學習設計方法。
因此,將流模型與抗體的序列、結構協同設計結合,設計一個基于流模型的生成式模型是本領域技術人員亟需解決的問題。
發明內容
有鑒于此,本發明提供了一種基于流模型的抗體序列結構協同設計方法;通過將蛋白質序列生成特異化到抗體序列生成,將抗體的序列和結構一同輸入圖神經網絡,再用圖神經網絡分別生成序列和結構,能夠得到更準確的數據分布,使得生成的抗體序列和結構更接近真實情況。
為了實現上述目的,本發明采用如下技術方案:
一種基于流模型的抗體序列結構協同設計方法,包括以下步驟:
S1、選取結構抗體數據集作為通用的抗體數據;
S2、獲取氨基酸序列信息及結構信息;
S3、將序列信息及結構信息編碼入圖神經網絡,對神經網絡進行更新,得到氨基酸編碼;
S4、將氨基酸編碼輸入至第一流模型中進行變換,得到氨基酸類型,將預測到的氨基酸類型輸入圖神經網絡,對其進行更新,得到新的氨基酸編碼;
S5、將新的氨基酸編碼輸入至第二流模型中進行變換,得到氨基酸的三維坐標信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210001847.6/2.html,轉載請聲明來源鉆瓜專利網。





