[發明專利]一種基于寡核苷酸序列編碼存儲的DNA存儲方法有效
| 申請號: | 201910090892.1 | 申請日: | 2019-01-30 |
| 公開(公告)號: | CN109830263B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 肖鵬峰;費中杰 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G16B30/20 | 分類號: | G16B30/20 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 田凌濤 |
| 地址: | 210000 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 寡核苷酸 序列 編碼 存儲 dna 方法 | ||
1.一種基于寡核苷酸序列編碼存儲的DNA存儲方法,用于針對待處理二進制編碼文件進行編碼存儲,其特征在于,包括如下步驟:
步驟A.?針對待處理二進制編碼文件、按順序進行劃分,獲得各個待處理二進制字符串片段,其中至少第一個待處理二進制字符串片段至倒數第一個待處理二進制字符串片段中,各待處理二進制字符串片段中字符的數目彼此相同,且該各待處理二進制字符串片段中字符的數目均為偶數,并進入步驟B;
步驟B.?基于DNA寡核苷酸序列存儲,獲得四個堿基A、G、C、T與四個二進制字符串00、01、10、11彼此之間一一對應的各種不同組合,并將各種不同組合作為各種不同編碼方式,然后進入步驟C;
步驟C.?分別針對各個待處理二進制字符串片段,應用各種不同編碼方式組合,以一個堿基替代兩個二進制字符的方式,針對待處理二進制字符串片段進行編碼,將該待處理二進制字符串片段中的字符轉換為對應的堿基,更新為寡核苷酸序列,且該寡核苷酸序列中同聚物區域的數目、高GC的含量分別滿足預設指標要求,進而獲得各待處理二進制字符串片段分別所對應的寡核苷酸序列,然后進入步驟D;
上述步驟C中,分別針對各個待處理二進制字符串片段,按如下步驟C01至步驟C06,應用各種不同編碼方式組合,針對待處理二進制字符串片段進行編碼;
步驟C01.?初始化參數n=1、x=1、y=1,并進入步驟C02;
步驟C02.?在各種不同編碼方式中,任選n種編碼方式,作為n種編碼應用方式,并進入步驟C03;
步驟C03.?以待處理二進制字符串片段中兩個二進制字符為一位,一個堿基替代一位中兩個二進制字符的方式,針對待處理二進制字符串片段中第x位兩個二進制字符,以第y種編碼應用方式進行編碼,將該位兩個二進制字符轉換為對應的堿基,并進入步驟C04;
步驟C04.?判斷x是否等于n的整數倍,是則針對x的值進行加1更新,同時重置y=1,并進入步驟C05;否則針對x的值、y的值,分別進行加1更新,并進入步驟C05;
步驟C05.?判斷x是否大于該待處理二進制字符串片段中字符長度/2的值,是則完成該待處理二進制字符串片段中字符到對應堿基的編碼,即獲得該待處理二進制字符串片段所對應的寡核苷酸序列,并進入步驟C06;否則返回步驟C03;
步驟C06.?判斷該寡核苷酸序列中同聚物區域的數目、高GC的含量是否分別均滿足預設指標要求,是則完成對該待處理二進制字符串片段的編碼操作,即獲得該待處理二進制字符串片段所對應的寡核苷酸序列;否則刪除該待處理二進制字符串片段所對應的寡核苷酸序列,并針對n的值進行加1更新,以及重置x=1、y=1,然后返回步驟C02;
步驟D.?分別獲得各待處理二進制字符串片段在待處理二進制編碼文件中的順序位置,并將順序位置轉換為A、G、C、T所構成、具有唯一信息的序列位置編碼,并按照一一對應關系、并入對應寡核苷酸序列中,更新各個寡核苷酸序列,然后進入步驟E;
步驟E.?分別獲得各個寡核苷酸序列中二進制字符串片段的編碼方式,并將編碼方式轉換為A、G、C、T所構成的編碼信息,按照一一對應關系、并入對應寡核苷酸序列,更新各個寡核苷酸序列,所獲各個寡核苷酸序列即實現對待處理二進制編碼文件的編碼存儲。
2.根據權利要求1所述基于一種基于寡核苷酸序列編碼存儲的DNA存儲方法,其特征在于:所述步驟C中,寡核苷酸序列中同聚物區域的數目不超過3-7個,以及高GC的含量不超過45%-50%。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910090892.1/1.html,轉載請聲明來源鉆瓜專利網。





