[發明專利]一種基于調制編碼的DNA存儲方法有效
| 申請號: | 202110557918.6 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113299347B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 劉文斌;昝鄉鎮;姚祥宇;李樹棟;許鵬;方剛;陳智華;石曉龍;鮑振申 | 申請(專利權)人: | 廣州大學 |
| 主分類號: | G16B50/00 | 分類號: | G16B50/00;G16B30/10;H03M13/39 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 黎揚鵬 |
| 地址: | 510006 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 調制 編碼 dna 存儲 方法 | ||
1.一種基于調制編碼的DNA存儲方法,其特征在于,包括以下步驟:獲取調制碼,將計算機文件轉換為二進制字符串,根據所述調制碼將所述二進制字符串進行調制編碼,得到DNA存儲序列;
將所述DNA存儲序列合成得到DNA分子序列,將所述DNA分子序列進行存儲;
將存儲的所述DNA分子序列進行測序,得到所述DNA分子序列的讀長,根據所述調制碼對所述讀長進行糾錯,將糾錯后的所述DNA分子序列恢復得到所述計算機文件;
所述DNA存儲序列包括索引值部分和數據域;所述獲取調制碼,將計算機文件轉換為二進制字符串,根據所述調制碼將所述二進制字符串進行調制編碼,得到DNA存儲序列這一步驟,其包括:
根據所述數據域與所述索引值部分的數據長度的差值對所述二進制字符串進行分組,并構建得到二進制存儲序列;
生成所述調制碼的調制碼序列;
將所述調制碼序列以及所述二進制存儲序列進行堿基替換得到所述DNA存儲序列;
所述調制碼序列包括若干調制單元,所述生成所述調制碼的調制碼序列這一步驟,其包括:
確定所述調制單元的長度,根據所述調制單元的長度以及預設的所述調制碼序列長度,將所述調制單元拼接得到所述調制碼序列;
所述將存儲的所述DNA分子序列進行測序,得到所述DNA分子序列的讀長,根據所述調制碼對所述讀長進行糾錯,將糾錯后的所述DNA分子序列恢復得到所述計算機文件這一步驟,其包括:
根據所述調制碼進對所述讀長中的錯誤進行校正,得到校正讀長;
對所述校正讀長進行分組,并確定每個分組中的一致性序列;
將所述一致性序列進行排序,去除排序后的一致性序列的索引值部分,轉碼拼接得到所述計算機文件;
所述根據所述調制碼對所述讀長中的錯誤進行校正,得到校正讀長這一步驟,其包括:
對所述讀長進行逐堿基替換得到觀測調制碼序列;
將所述觀測調制碼序列與所述調制碼序列進行全局對比,根據比對的觀測調制碼結果對所述讀長進行校正或校準得到所述校正讀長。
2.根據權利要求1所述的一種基于調制編碼的DNA存儲方法,其特征在于,所述對所述校正讀長進行分組,并確定每個分組中的一致性序列這一步驟,其包括:
生成所述校正讀長的讀長校正信息,所述根據所述讀長校正信息將所述校正讀長分類得到無校正序列和有校正序列;
根據所述索引值部分將所述無校正序列進行分組,得到若干第一集合;根據所述無校正序列的堿基內容對所述第一集合中的序列進行篩除,和/或選擇所述有校正序列對所述第一集合進行擴充;
從所述篩除和/或擴充后的第一集合通過投票產生高頻存儲序列作為所述一致性序列。
3.根據權利要求2所述的一種基于調制編碼的DNA存儲方法,其特征在于,所述根據所述無校正序列的堿基內容對所述第一集合中的序列進行篩除這一步驟,其包括:
確定分組純化閾值,確定所述第一集合中的第一序列與其他序列的漢明距離均值大于所述分組純化閾值,將所述第一序列從所述第一集合中刪除。
4.根據權利要求2所述的一種基于調制編碼的DNA存儲方法,其特征在于,所述選擇所述有校正序列對所述第一集合進行擴充這一步驟,其包括:
根據所述讀長校正信息以及所述索引值部分的漢明距離,將所述有校正序列進行排序得到第一列表;
確定所述第一列表中的第二序列與所述第一列表中其他序列的漢明距離均值小于分組純化閾值,將所述第二序列添加至所述第一集合中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州大學,未經廣州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110557918.6/1.html,轉載請聲明來源鉆瓜專利網。





