[發(fā)明專利]高熱穩(wěn)定性酶的蛋白序列生成方法、裝置、介質和設備在審
| 申請?zhí)枺?/td> | 202110726343.6 | 申請日: | 2021-06-29 |
| 公開(公告)號: | CN113539374A | 公開(公告)日: | 2021-10-22 |
| 發(fā)明(設計)人: | 羅小舟;余函 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B25/00;G16B30/00 |
| 代理公司: | 深圳市銘粵知識產權代理有限公司 44304 | 代理人: | 孫偉峰;劉燚圣 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 高熱 穩(wěn)定性 蛋白 序列 生成 方法 裝置 介質 設備 | ||
本發(fā)明公開了一種高熱穩(wěn)定性酶的蛋白序列生成方法、裝置、介質和設備。所述蛋白序列生成方法包括:獲取訓練樣本,所述訓練樣本包括耐受溫度大于預定值的特定類酶的蛋白序列數(shù)據(jù);利用訓練樣本對預先構建好的生成式對抗網(wǎng)絡模型進行訓練,獲得蛋白序列生成模型;利用所述蛋白序列生成模型生成批量蛋白序列數(shù)據(jù)。本方法利用現(xiàn)有的耐受溫度大于預定值的特定類酶的蛋白序列數(shù)據(jù)訓練生成式對方模型,得到蛋白序列生成模型,可以批量生成高熱穩(wěn)定的特定類酶的序列,生成方法簡單,僅從蛋白序列出發(fā)且在計算機上完成設計,并可進一步按相似性分布進行實驗驗證,結果可靠性更強且容易分析。
技術領域
本發(fā)明屬于生物醫(yī)藥技術領域,具體地講,涉及一種高熱穩(wěn)定性酶的蛋白序列生成方法、蛋白序列生成裝置、計算機可讀存儲介質、計算機設備。
背景技術
高熱穩(wěn)定性的酶在生物燃料、生物化工等領域有著極其重要的作用。傳統(tǒng)的獲取方法主要是通過從嗜熱菌中進行分離,并通過實驗驗證、改進和優(yōu)化后投入工業(yè)使用。但是傳統(tǒng)的分離方法分離得到的酶數(shù)量有限,無法滿足工業(yè)上特定場景上越來越豐富的需求,從頭設計一些全新的高熱穩(wěn)定性的酶就變得尤為重要。目前的兩類主流方法,一類是基于理性設計的方法,主要是通過結構化修飾進行改造,另一類則是基于定向進化的方法,但是這些改造的能力具有一定的局限性,獲得的高熱穩(wěn)定性的酶數(shù)量有限。其中,基于理性設計的方法需要對酶結構等信息較為詳細的了解,對已有的改造方法非常熟悉,改造過程較為復雜,同時很難批量生成;基于定向進化的方法通過建立隨機突變庫從中篩選對應的酶,但該方法成功率較低,且工作量巨大,很難批量進行生成。同時,兩類方法都沒有從理論的角度對序列進行系統(tǒng)性的比較分析。
因此,亟待開發(fā)一套能批量設計全新的高熱穩(wěn)定性的酶的方法。
發(fā)明內容
(一)本發(fā)明所要解決的技術問題
本發(fā)明解決的技術問題是:如何快速批量化地生成高熱穩(wěn)定性酶的蛋白序列。
(二)本發(fā)明所采用的技術方案
一種高熱穩(wěn)定性酶的蛋白序列生成方法,其特征在于,所述蛋白序列生成方法包括:
獲取訓練樣本,所述訓練樣本包括耐受溫度大于預定值的特定類酶的蛋白序列數(shù)據(jù);
利用訓練樣本對預先構建好的生成式對抗網(wǎng)絡模型進行訓練,獲得蛋白序列生成模型;
利用所述蛋白序列生成模型生成批量蛋白序列數(shù)據(jù)。
所述生成式對抗網(wǎng)絡模型包括生成器和判別器,所述利用訓練樣本對預先構建好的生成式對抗網(wǎng)絡模型進行訓練,獲得蛋白序列生成模型的具體方法包括:
將隨機噪聲輸入到生成器,生成器輸出生成數(shù)據(jù),從所述訓練樣本中選取部分數(shù)據(jù)作為真實數(shù)據(jù);
將所述生成數(shù)據(jù)和所述真實數(shù)據(jù)共同輸入至所述判別器中,判別器輸出判別結果;
根據(jù)判別結果調整所述生成器和所述判別器的網(wǎng)絡參數(shù),以完成一輪訓練;
重復上述訓練步驟直至滿足預定訓練條件,以獲得所述蛋白序列生成模型。
優(yōu)選地,獲取訓練樣本的方法包括:
獲取耐受溫度大于預定值的各種微生物的蛋白組序列;
從所述蛋白組序列中確定與所述特定類酶處于同一類別下的目標酶,并提取出所述目標酶的目標蛋白序列;
利用序列聚類算法對所述目標蛋白序列進行聚類處理得到多個類簇的蛋白序列,選擇類簇大于閾值的蛋白序列作為訓練樣本。
優(yōu)選地,所述訓練樣本還包括與所述特定類酶處于同一類別下的初始樣本酶的蛋白序列數(shù)據(jù),在利用所述利用訓練樣本對預先構建好的生成式對抗網(wǎng)絡模型進行訓練之前,所述蛋白序列生成方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經(jīng)深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110726343.6/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種可分配風量的集成灶及其控制方法
- 下一篇:半導體器件及其形成方法





