[發(fā)明專利]信使核糖核酸密碼子序列的處理方法、裝置及電子設備在審
| 申請?zhí)枺?/td> | 202310202151.4 | 申請日: | 2023-03-03 |
| 公開(公告)號: | CN116246716A | 公開(公告)日: | 2023-06-09 |
| 發(fā)明(設計)人: | 賀選;王德品 | 申請(專利權)人: | 南京燧坤智能科技有限公司 |
| 主分類號: | G16B50/40 | 分類號: | G16B50/40;G16B40/00;G16B30/10;G16B25/10 |
| 代理公司: | 北京康信知識產(chǎn)權代理有限責任公司 11240 | 代理人: | 董文倩 |
| 地址: | 210033 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信使 核糖核酸 密碼子 序列 處理 方法 裝置 電子設備 | ||
1.一種信使核糖核酸密碼子序列的處理方法,其特征在于,包括:
對多個初始密碼子序列進行分類處理,得到第一序列集和第二序列集,其中,所述第一序列集和所述第二序列集是基于所述多個初始密碼子序列分別對應的蛋白表達水平和所述多個初始密碼子序列分別對應的半衰期確定的,所述多個初始密碼子序列對應于不同的信使核糖核酸;
采用所述第一序列集,所述第二序列集,以及所述多個初始密碼子序列對應的氨基酸序列,對預先構建的循環(huán)生成對抗網(wǎng)絡模型進行訓練,得到訓練后的循環(huán)生成對抗網(wǎng)絡模型;
基于所述訓練后的循環(huán)生成對抗網(wǎng)絡模型,將所述第二序列集中的初始密碼子序列轉(zhuǎn)換為具備第一序列特征的目標密碼子序列,其中,所述第一序列特征為與所述第一序列集對應的序列特征。
2.根據(jù)權利要求1所述的方法,其特征在于,所述對多個初始密碼子序列進行分類處理,得到第一序列集和第二序列集,包括:
獲取所述多個初始密碼子序列對應的所述蛋白表達水平,以及所述多個初始密碼子序列對應的所述半衰期;
基于所述多個初始密碼子序列中所述蛋白表達水平大于第一預設數(shù)量,并且所述半衰期大于第二預設數(shù)量的密碼子序列,得到所述第一序列集;
基于所述多個初始密碼子序列中所述蛋白表達水平小于第三預設數(shù)量,或者所述半衰期小于第四預設數(shù)量的密碼子序列,得到所述第二序列集,其中,所述第一預設數(shù)量大于所述第三預設數(shù)量,所述第二預設數(shù)量大于所述第四預設數(shù)量,所述第一預設數(shù)量與所述第三預設數(shù)量之間的差值大于預設第一差值,第二預設數(shù)量與所述第四預設數(shù)量之間的差值大于預設第二差值。
3.根據(jù)權利要求1所述的方法,其特征在于,在所述采用所述第一序列集,所述第二序列集,以及所述多個初始密碼子序列對應的氨基酸序列,對預先構建的循環(huán)生成對抗網(wǎng)絡模型進行訓練,得到訓練后的循環(huán)生成對抗網(wǎng)絡模型之后,所述方法還包括:
獲取第一密碼子序列;
基于所述訓練后的循環(huán)生成對抗網(wǎng)絡模型,將所述第一密碼子序列轉(zhuǎn)換為具備所述第一序列特征的所述目標密碼子序列。
4.根據(jù)權利要求1至3中任意一項所述的方法,其特征在于,在所述循環(huán)生成對抗網(wǎng)絡模型包括第一生成器,與所述第一生成器對應的第一判別器,第二生成器,與所述第二生成器對應的第二判別器,以及翻譯器的情況下,所述采用所述第一序列集,所述第二序列集,以及所述多個初始密碼子序列對應的氨基酸序列,對預先構建的循環(huán)生成對抗網(wǎng)絡模型進行訓練,得到訓練后的循環(huán)生成對抗網(wǎng)絡模型,包括:
基于所述第一序列集,對所述第一生成器進行訓練,得到第三生成器,以及具有第二序列特征的第一生成序列集,其中,所述第二序列特征為與所述第二序列集對應的序列特征;
基于所述第一生成序列集和所述第二序列集,采用所述第一判別器,得到第一判別結果,其中,所述第一判別結果用于指示所述第一生成序列集與所述第二序列集之間的第一區(qū)分度;
基于所述第二序列集,對所述第二生成器進行訓練,得到第四生成器,以及具有所述第一序列特征的第二生成序列集;
基于所述第二生成序列集和所述第一序列集,采用所述第二判別器,得到第二判別結果,其中,所述第二判別結果用于指示所述第二生成序列集與所述第一序列集之間的第二區(qū)分度;
基于所述第一生成序列集和所述第二生成序列集,對所述翻譯器進行訓練,得到訓練后的翻譯器,所述第一生成序列集中包括的密碼子序列分別對應的第一氨基酸序列,以及所述第二生成序列集中包括的密碼子序列分別對應的第二氨基酸序列;
判斷所述第一區(qū)分度和所述第二區(qū)分度是否小于預設區(qū)分度;判斷所述第一序列集中的初始密碼子序列對應的氨基酸序列,與對應的第一氨基酸序列之間的第一相似度是否大于預設相似度;以及判斷所述第二序列集中的初始密碼子序列對應的氨基酸序列,與對應的第二氨基酸序列之間的第二相似度是否大于預設相似度;
若所述第一區(qū)分度小于所述預設區(qū)分度,并且所述第二區(qū)分度小于所述預設區(qū)分度,所述第一相似度大于所述預設相似度,并且所述第二相似度大于所述預設相似度,則停止對所述第一生成器和所述第二生成器的訓練,并基于最后一次訓練對應的所述第三生成器、所述第四生成器、所述第一判別器、所述第二判別器以及所述訓練后的所述翻譯器,得到所述訓練后的循環(huán)生成對抗網(wǎng)絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京燧坤智能科技有限公司,未經(jīng)南京燧坤智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310202151.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





