[發明專利]密碼子優化有效
| 申請號: | 201980050408.0 | 申請日: | 2019-07-30 |
| 公開(公告)號: | CN112513989B | 公開(公告)日: | 2022-03-22 |
| 發明(設計)人: | 樊隆 | 申請(專利權)人: | 南京金斯瑞生物科技有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00 |
| 代理公司: | 北京華睿卓成知識產權代理事務所(普通合伙) 11436 | 代理人: | 程淼 |
| 地址: | 211100 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 密碼子 優化 | ||
1.一種用于優化在宿主中表達蛋白質的核酸序列的計算機實現方法,所述計算機實現方法包括:
a)接收初始群體集,其中所述初始群體集包含能夠表達所述蛋白質的多個初始候選核酸序列;和
b)基于所述初始群體集,使用計算機輔助的NSGA-III算法或其變型執行協調指數、密碼子背景指數和離群指數的優化,從而獲得能夠表達所述蛋白質的多個優化的核酸序列,
其中候選核酸序列的所述協調指數指示多個高度表達的基因和所述候選核酸序列之間的同義密碼子的使用頻率分布的一致性,
其中所述候選核酸序列的所述密碼子背景指數是將同義密碼子置于合適位置的量度,且
其中所述候選核酸序列的所述離群指數是多個預定序列特征對所述候選核酸序列的負面影響的量度;
其中候選核酸序列的所述協調指數基于下式計算:H=1-D(Fhs,Fts),
其中D()指示測量兩個矢量之間的距離的函數,其包括兩個矢量的歐幾里德距離;
其中Fhs包括包含多個高度表達的基因內的多個氨基酸的同義密碼子的頻率的矢量;并且
其中Fts包括包含所述候選核酸序列的編碼基因內的所述多個氨基酸的同義密碼子的頻率的矢量;
其中所述多個高度表達的基因或候選核酸序列的同義密碼子的頻率被定義為:且59個同義密碼子。
2.根據權利要求1所述的方法,其還包括提供指示所述多個優化的核酸序列中的至少一個優化的核酸序列的輸出。
3.如權利要求1所述的方法,其中接收初始群體集包括:
接收蛋白質序列;
基于接收的蛋白質序列產生所述初始群體集。
4.如權利要求1所述的方法,其中接收初始群體集包括:
接收核酸序列;
將接收的核酸序列翻譯成蛋白質序列;
基于所述蛋白質序列產生所述初始群體集。
5.如權利要求1所述的方法,其中所述初始群體集具有預定大小。
6.根據權利要求1所述的方法,其中所述初始群體集包括所述多個初始候選核酸序列的二進制表示。
7.如權利要求1所述的方法,其中執行協調指數、密碼子背景指數和離群指數的優化包括:
最大化所述協調指數;
最大化所述密碼子背景指數;和
最小化所述離群指數。
8.如權利要求1所述的方法,其中執行協調指數、密碼子背景指數和離群指數的優化包括:
針對所述初始群體集的每個初始候選核酸序列,計算各自的初始候選核酸序列的各自的協調指數值、各自的密碼子背景指數值和各自的離群指數值;
基于所述計算,分配對應于所述多個初始候選核酸序列的多個適應度值;
基于所述多個適應度值,對所述多個初始候選核酸序列進行分選;以及
將經分選的多個初始候選核酸序列的子集納入在后續群體集中。
9.如權利要求8所述的方法,其還包括:
基于所述初始群體產生后代群體;以及
將所述后代群體納入在所述后續群體集中。
10.如權利要求9所述的方法,其中所述后代群體通過二進制錦標賽選擇、交叉/重組、突變或其任何組合產生。
11.如權利要求8所述的方法,其中所述初始群體集和所述后續群體集具有相同的大小。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京金斯瑞生物科技有限公司,未經南京金斯瑞生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980050408.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:環氧烷烴的制造方法和固體氧化催化劑
- 下一篇:光學單元





