[發明專利]模型訓練、抗體改造和結合位點預測的方法與裝置有效
| 申請號: | 202110594661.1 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113764037B | 公開(公告)日: | 2023-10-27 |
| 發明(設計)人: | 蔣彪彬;許振雷;劉偉;黃俊洲 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B15/30;G16B40/00 |
| 代理公司: | 北京勵誠知識產權代理有限公司 11647 | 代理人: | 趙爽 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 抗體 改造 結合 預測 方法 裝置 | ||
本申請實施例提供一種模型訓練、抗體改造和結合位點預測的方法與裝置,訓練方法包括:使用N條第一抗體序列,對預測模型進行預訓練,得到預訓練后的預測模型,其中第一抗體序列中未標注出所述第一抗體序列與抗原的結合位點,預訓練后的預測模型用于預測抗體序列中被掩蓋的氨基酸的預測值。由于未標注的第一抗體系列的數量較多,使用大量的第一抗體序列對預測模型進行預訓練,可以使該預測模型得到充分的訓練,進而提高了預測模型的訓練準確性。另外,在預測模型的預訓練過程中,對第一抗體序列的可變區進行著重學習,以進一步提高預測模型的訓練準確度,使用該預測模型進行抗體相關預測工作時,其預測成本低,且預測效率高。
技術領域
本申請實施例涉及計算機技術領域,尤其涉及一種模型訓練、抗體改造和結合位點預測的方法與裝置。
背景技術
抗體是一種重要的免疫蛋白,負責識別生物體內的外來入侵者或內在的變異,即抗原,并與抗原進行結合,以清除抗原。
抗體重要的性質是與抗原結合的親和力,親和力大小由抗體與抗原的結合位點決定。在抗體親和力不夠高時,需要對抗體進行改造,以提高抗體親和力。
目前對抗體的相關預測工作,主要依賴于結構解析實驗或分子敲除篩選實驗,其成本高,且耗時。
發明內容
本申請實施例提供一種模型訓練、抗體改造和結合位點預測的方法與裝置,以降低抗體相關預測工作的成本,提高預測效率。
第一方面,本申請實施例提供一種用于抗體的預測模型的訓練方法,包括:
獲取N條第一抗體序列,所述N為正整數,所述第一抗體序列中未標注出所述第一抗體序列與抗原的結合位點;
使用所述N條第一抗體序列,對預測模型進行預訓練,得到預訓練后的預測模型,所述預訓練后的預測模型用于預測抗體序列中被掩蓋的氨基酸的預測值,在所述預測模型的預訓練過程中,所述第一抗體序列的可變區的學習頻率高于所述第一抗體序列的不可變區的學習頻率。
第二方面,本申請實施例提供一種預測抗體中改造點的預測值的方法,包括:
獲取待改造的目標抗體序列;
接收所述用戶對所述目標抗體序列中待改造的目標位點氨基酸的掩蓋操作;
響應于所述掩蓋操作,將目標位點氨基酸被掩蓋的所述目標抗體序列輸入預訓練的預測模型中,得到所述預訓練的預測模型輸出的所述目標位點氨基酸的預測值;
其中,所述預訓練的預測模型是經過第一抗體序列訓練得到的,所述第一抗體序列中未標注出所述第一抗體序列與抗原的結合位點,在所述預測模型的預訓練過程中,所述第一抗體序列的可變區的學習頻率高于所述第一抗體序列的不可變區的學習頻率。
在一些實施例中,所述獲取待改造的目標抗體序列,包括:
顯示輸入框,并接收所述用戶在所述輸入框內輸入的待改造的目標抗體序列。
在一些實施例中,所述響應于所述掩蓋操作,將目標位點氨基酸被掩蓋的所述目標抗體序列輸入預訓練后的預測模型中,得到所述預訓練后的預測模型輸出的所述目標位點氨基酸的預測值,包括:
在檢測到所述用戶的預測觸發操作時,響應于所述掩蓋操作,將所述目標位點氨基酸被掩蓋的所述目標抗體序列輸入預訓練后的預測模型中,得到所述預訓練后的預測模型輸出的所述目標位點氨基酸的預測值。
第三方面,本申請實施例提供一種抗體結合位點的預測方法,包括:
獲取待預測的目標抗體序列;
將所述目標抗體序列輸入目標預測模型中,預測所述目標抗體序列與抗原的結合位點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110594661.1/2.html,轉載請聲明來源鉆瓜專利網。





