[發(fā)明專利]一種機(jī)器學(xué)習(xí)基因挖掘方法及氨基轉(zhuǎn)位用草銨膦脫氫酶突變體有效
| 申請(qǐng)?zhí)枺?/td> | 202011644056.2 | 申請(qǐng)日: | 2020-12-31 |
| 公開(kāi)(公告)號(hào): | CN112725298B | 公開(kāi)(公告)日: | 2022-12-06 |
| 發(fā)明(設(shè)計(jì))人: | 薛亞平;程峰;吳冬陽(yáng);鄒樹(shù)平;徐建妙;鄭裕國(guó) | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | C12N9/06 | 分類號(hào): | C12N9/06;C12N15/53;C12N1/21;C12P13/04;G06N20/00;C12R1/19 |
| 代理公司: | 杭州天勤知識(shí)產(chǎn)權(quán)代理有限公司 33224 | 代理人: | 沈金龍 |
| 地址: | 310014 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機(jī)器 學(xué)習(xí) 基因 挖掘 方法 氨基 轉(zhuǎn)位用草銨膦 脫氫酶 突變體 | ||
1.一種氨基轉(zhuǎn)位用草銨膦脫氫酶突變體,其特征在于,由來(lái)源于湖南假單胞菌(Pseudomonas hunanensis)的草銨膦脫氫酶突變所得,野生型草銨膦脫氫酶的氨基酸序列如SEQ ID No.2所示,所述氨基轉(zhuǎn)位用草銨膦脫氫酶突變體的突變位點(diǎn)選自以下一種:
(1)E263D-K134R-H96A-R290V;
(2)E263D-K134R-H96A;
(3)E263D-K134R;
(4)E263D;
(5)E263N;
(6)E263C;
(7)E263G。
2.編碼如權(quán)利要求1所述氨基轉(zhuǎn)位用草銨膦脫氫酶突變體的基因。
3.一種基因工程菌,包括宿主細(xì)胞和轉(zhuǎn)入宿主細(xì)胞的目的基因,其特征在于,所述目的基因包含如權(quán)利要求2所述的基因。
4.如權(quán)利要求3所述的基因工程菌,其特征在于,目的基因還包括葡萄糖脫氫酶的編碼基因。
5.如權(quán)利要求4所述的基因工程菌,其特征在于,葡萄糖脫氫酶的編碼基因序列的GenBank登錄號(hào)為KM817194.1。
6.權(quán)利要求1所述氨基轉(zhuǎn)位用草銨膦脫氫酶突變體、權(quán)利要求2所述基因或權(quán)利要求3~5任一所述基因工程菌在制備L-草銨膦中的應(yīng)用。
7.一種L-草銨膦的制備方法,其特征在于,以2-羰基-4-(羥基甲基膦酰基)丁酸為底物,在無(wú)機(jī)氨基供體、輔酶循環(huán)系統(tǒng)及對(duì)應(yīng)輔助底物存在的條件下,利用催化劑催化底物反應(yīng)獲得L-草銨膦;
所述催化劑為以下一種:
(1)權(quán)利要求1所述氨基轉(zhuǎn)位用草銨膦脫氫酶突變體;
(2)能夠產(chǎn)生權(quán)利要求1所述氨基轉(zhuǎn)位用草銨膦脫氫酶突變體的基因工程菌或該基因工程菌經(jīng)裂解得到的粗酶液。
8.如權(quán)利要求7所述的制備方法,其特征在于,所述輔酶循環(huán)系統(tǒng)為以下至少一種:
(1)甲酸脫氫酶輔酶循環(huán)系統(tǒng):包括甲酸脫氫酶、甲酸鹽和輔酶;
(2)葡萄糖脫氫酶輔酶循環(huán)系統(tǒng):包括葡萄糖脫氫酶、葡萄糖和輔酶;
(3)乙醇脫氫酶輔酶循環(huán)系統(tǒng):包括乙醇脫氫酶、異丙醇和輔酶。
9.如權(quán)利要求8所述的制備方法,其特征在于,所述甲酸脫氫酶來(lái)源于乳桿菌屬(Lactobacillus buchneri),氨基酸序列的NCBI登錄號(hào)為WP_013726924.1;所述葡萄糖脫氫酶來(lái)源于微小桿菌屬(Exiguobacterium sibiricum),編碼基因的NCBI登錄號(hào)為KM817194.1;所述乙醇脫氫酶來(lái)源于乳桿菌屬(Lactobacillus brevis),編碼基因的NCBI登錄號(hào)為L(zhǎng)K055285.1。
10.一種機(jī)器學(xué)習(xí)基因挖掘方法,其特征在于,包括以下步驟:
(1)建立決策樹(shù):從基因庫(kù)中隨機(jī)選取序列,針對(duì)機(jī)器學(xué)習(xí)工具包scikit-learn構(gòu)造,采用隨機(jī)森林n_estimator參數(shù)設(shè)置為1000,其余參數(shù)保留為默認(rèn)值:有放回地隨機(jī)選擇10個(gè)樣本,選擇好了的10個(gè)樣本用來(lái)訓(xùn)練一個(gè)決策樹(shù),作為決策樹(shù)根節(jié)點(diǎn)處的樣本;
(2)設(shè)定特性,包括以下特性:
(a)蛋白質(zhì)大小:候選蛋白質(zhì)的長(zhǎng)度300-500個(gè)氨基酸,
(b)草銨膦脫氫酶的兩端必要特性序列:第一段為GGGKGG,第二段為VVTG、FVTG、VLTG、VFTG、FITG、FFTG、VVFG、FVFTG、VLFG、VFFG、FLFG、FFFG其中之一;
(3)決策樹(shù)分裂:當(dāng)每個(gè)樣本具有以上各特性時(shí),當(dāng)決策樹(shù)的節(jié)點(diǎn)需要分裂,隨機(jī)從這各特性中選取出1個(gè),決策樹(shù)形成過(guò)程中每個(gè)節(jié)點(diǎn)都要按照步驟(2)來(lái)分裂,一直到不能夠再分裂為止;
(4)按照步驟(1)~(3)建立決策樹(shù),形成隨機(jī)森林,將基因庫(kù)中的基因放入該隨機(jī)森林,讓隨機(jī)森林中的每一棵決策樹(shù)分別進(jìn)行判斷和分類,選擇基因最多的樹(shù);
(5)將步驟4基因最多的樹(shù)中的基因與已知的草銨膦脫氫酶進(jìn)行氨基酸序列比對(duì),選取其中序列相似度最高的基因作為篩選到的草銨膦脫氫酶基因。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011644056.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 心腦血管疾病易感基因芯片檢測(cè)試劑盒
- 一組用于頭頸部鱗狀細(xì)胞癌分子分型的基因及其應(yīng)用
- 產(chǎn)β-丙氨酸的重組菌及其構(gòu)建方法與應(yīng)用
- 一種檢測(cè)高血壓藥物代謝相關(guān)基因的引物組和試劑盒
- 一組用于腎細(xì)胞癌分子分型的基因及其應(yīng)用
- 一組用于膀胱癌檢測(cè)的基因及其應(yīng)用
- 一組用于髓母細(xì)胞瘤分子分型的基因及其應(yīng)用
- 一種頭發(fā)相關(guān)的基因位點(diǎn)庫(kù)及其應(yīng)用
- 馬度米星化合物的生物合成基因簇及其應(yīng)用
- 彌漫性大B細(xì)胞淋巴瘤分子分型試劑盒及分型裝置





