[發明專利]一種自動構建DFA圖用于核酸序列設計的方法在審
| 申請號: | 202211410452.8 | 申請日: | 2022-11-11 |
| 公開(公告)號: | CN115798589A | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 夏苗仁;葛虎 | 申請(專利權)人: | 唯信知藥(上海)科技有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B50/50 |
| 代理公司: | 廣州市合本知識產權代理事務所(普通合伙) 44421 | 代理人: | 劉潔 |
| 地址: | 201208 上海市浦東新區中國(上海)自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 構建 dfa 用于 核酸 序列 設計 方法 | ||
本發明涉及計算機輔助藥物研發和生物工程技術領域,具體涉及一種自動構建DFA圖用于核酸序列設計的方法,包括步驟A.讀取給定物種的密碼子表,以獲得每一種氨基酸的密碼子序列;步驟B.構建初始的氨基酸殘基的DFA子圖;步驟C.將初始的氨基酸殘基的DFA子圖進行連接,形成RNA或DNA的DFA圖;步驟D.將RNA或DNA的DFA圖進行壓縮優化,合并刪除冗余的邊和頂點,使得該DFA圖具有最少的頂點和邊;步驟C和步驟D的操作順序可以互換。該方法可以支持任意長度的序列和任意合法的密碼子表,從而將用于藥物和蛋白表達系統的核酸序列設計方法拓展并應用到不同生物和蛋白表達系統,避免了設計過程中冗余的計算量,為核酸序列設計提供了計算時間上有效和優化的解決手段。
技術領域
本發明涉及計算機輔助藥物研發和生物工程技術領域,具體涉及一種自動構建DFA圖用于核酸序列設計(包括RNA藥物和DNA蛋白表達系統)的方法。
背景技術
根據中心法則,DNA轉錄成信使RNA(mRNA),在核糖體上翻譯產生相應的蛋白質,進而發揮生物學功能。其中從初始密碼子開始至終止密碼子結束,每三個連續的殘基形成的密碼子對應一個天然氨基酸。mRNA藥物作為新興的藥物形式,已成為藥物研發領域的研究熱點。在mRNA序列中,密碼子與氨基酸的對應關系為一對多,同時不同的密碼子選擇會影響到mRNA的穩定性、翻譯效率等性質。因此,藥物設計中需要同時滿足mRNA分子的化學穩定性和翻譯效率的適配性。
另外,在生物工程實驗和生產過程中,制備高質量、高純度、高天然保真性的蛋白,是許多過程關鍵性的第一步。多年來,生物技術上的巨大進步使得大規模表達和分離重組蛋白得以實現。然而,對于酶、抗體或疫苗生產等大規模應用,所需蛋白質的量相當高。因此,通過優化質粒等DNA載體的序列設計,進而提高蛋白表達的效率是重要的研發步驟。
以上DNA載體和mRNA疫苗具有類似的生物學基礎,因此可以使用相同的技術方案進行序列設計。例如公開號為CN114974428A、專利名稱為《用于序列設計的系統和方法》的發明專利,其技術方案中給出了序列設計的技術基石,提供了基于RNA或DNA的DFA圖上進行線性復雜度的設計方法,該方法根據設計的新冠病毒刺突蛋白疫苗初步的動物試驗,獲得了增強的抗原蛋白表達量和最高20倍的相關中和免疫球蛋白,得到了更好的藥效。除了對人體mRNA疫苗的設計,該方法還可以應用到其他生物蛋白表達系統載體上的核酸序列的優化。不同生物,甚至是同一個生物系統的不同蛋白表達系統具有不同的密碼子表。比如核基因組與線粒體、葉綠體基因組使用的密碼子表不同,在標準的密碼子表中,AGA和AGG編碼精氨酸,但在脊椎動物的線粒體中,這兩個密碼子卻是終止密碼子。而標準密碼子表中的終止密碼子UGA,在脊椎動物的線粒體中,卻是編碼色氨酸(注:線粒體基因組不光能夠用胞漿中的核糖體與tRNA來翻譯蛋白,它還能編碼自己的核糖體和tRNA,用獨特的密碼子表來翻譯蛋白)。在不同生物中,線粒體與核基因組的密碼子差異,也是不同的。
然而,在上述專利技術方案中,采用人工手動的方式編碼生物的密碼子所對應氨基酸(包括終止密碼)的DFA子圖,當面對不同物種如此多樣的密碼子表以及合成生物學中定制的翻譯系統,是無法有效率地覆蓋所有可能的情況,或是生成的DFA圖并不是最優的形式。顯然,應對自然界中不同物種不一樣的密碼子表的問題,人工編碼的方式顯然無法滿足需求。因此,急需對現有的核酸序列設計方法進行優化,從而能夠拓展并應用到不同生物和蛋白表達系統,以應對不同物種和蛋白表達系統中的多樣的密碼子表。
發明內容
本發明的目的在于針對現有技術中的不足,而提供一種自動構建DFA圖用于核酸序列設計的方法,該方法基于最原始的生物的密碼子表的同時,自動生成優化后的DFA圖,可以支持任意長度的序列和任意合法的密碼子表,從而將核酸序列設計方法拓展并應用到不同生物和蛋白表達系統。
本發明的目的通過以下技術方案實現:
提供一種自動構建DFA圖用于核酸序列設計的方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于唯信知藥(上海)科技有限公司,未經唯信知藥(上海)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211410452.8/2.html,轉載請聲明來源鉆瓜專利網。





