[發明專利]可包含人造堿基的DNA存儲分層表示與交織編碼方法有效
| 申請號: | 201810573636.3 | 申請日: | 2018-06-06 |
| 公開(公告)號: | CN110569974B | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 陳為剛;韓昌彩 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06N3/12 | 分類號: | G06N3/12;H03M13/27 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 包含 人造 堿基 dna 存儲 分層 表示 交織 編碼 方法 | ||
本發明公開了可包含人造堿基的DNA存儲分層表示與交織編碼方法,屬于DNA存儲可靠編碼領域,本發明將二進制數據加擾、分組糾錯碼后分為若干子塊,來自不同編碼子塊按分層方式組成寡核苷酸分子,當分子丟失或堿基發生錯誤時,錯誤會被分散到多個糾錯碼糾錯;采用圍長大的二部圖實現分層與分組碼的對應,可實現很多寡核苷酸分子組成整體,提高糾錯能力與DNA存儲的可靠性。進一步,包含人造堿基對,增大單堿基的存儲容量,也可將每個分子分解為更多層,改善糾錯性能與存儲效率。本發明的優勢在于,可包含人造堿基,提高單堿基存儲密度;通過分層與基于二部圖的交織保證存儲可靠性;提供了一種高可靠性、高密度的DNA存儲編碼方法。
技術領域
本發明涉及利用寡核苷酸分子實現數據可靠存儲的領域,尤其涉及一種可包含人造堿基的DNA存儲分層表示與交織編碼方法。
背景技術
隨著各種信息獲取手段的發展,現有的信息存儲方法已經不能滿足人類產生的海量數字信息的發展速度。目前,主要信息存儲介質包括:磁盤、光盤、非易失性半導體存儲等。存儲方式主要有基于計算機的獨立存儲、網絡存儲、分布式存儲、以及云存儲等。但是,基于這些傳統存儲媒介的存儲方法與技術,均存在諸多挑戰。第一,據預測,目前主要存儲方式都難以滿足快速增長的數據存儲需求。第二,目前主流大數據存儲方式,例如:云存儲與數據中心,也面臨巨大的電力、設備、場地以及人力等成本。第三,這些傳統存儲媒介能夠使用的壽命一般少于幾十年,都不能滿足重要數據的長期存儲與資料備份需求,例如:重要的歷史檔案、文獻資料等。此外,傳統的基于磁、光、電等的存儲方式,存儲設備的物理安全性與災備也存在很大風險,例如:在普通硬盤或者硬盤陣列存儲的數據,如果發生進水事故,會造成數據的丟失。另一方面,數據的重要性也不斷提升,尤其是目前基于數據的應用不斷發展,數據成為重要的資產。根據相關報道,911事件造成的數據丟失陸續使得很多公司因數據資產丟失而倒閉。
脫氧核糖核酸(DNA)存儲是將數字信息存儲在DNA的堿基序列,將人工合成的DNA分子作為存儲媒介的新型存儲方式,具有密度高、體積小,存儲時間長的優點,成為未來很有潛力的一種海量數據存儲方法。DNA存儲可以分為活體內存儲和體外存儲,利用寡核苷酸的四個不同堿基也即:腺嘌呤、胸腺嘧啶、胞嘧啶和鳥嘌呤,分別簡稱為A、T、C和G,表示數據,通過包含不同堿基的DNA或寡核苷酸分子實現大量數據存儲,是一種新興的數據存儲方式。隨著人類活動產生的信息數據不斷增長、數據重要性也不斷凸顯,DNA存儲成為未來很有潛力的海量數據長期存儲方法。
DNA存儲采用大量寡核苷酸分子的不同堿基{A,T,G,C}來存儲數據,而目前的主流的DNA合成方法與測序方法都是基于大量寡核苷酸分子的同時處理,具有通量很大的特點。但是,在DNA存儲中,寡核苷酸序列合成、聚合酶鏈式反應(PCR)以及序列堿基測定等過程會造成各種類型的錯誤。因此,如何設計合適的糾錯編碼技術保證數據在寡核苷酸分子中存儲的可靠性成為一個重要問題。
糾錯編碼技術在DNA存儲中的應用有望解決存儲成本與可靠性的問題,是一種非常有潛力的技術。一方面,目前的寡核苷酸分子合成的錯誤率較高,一般為幾百個堿基會發生一個合成錯誤;若采用生化方法進一步提高合成堿基的可靠性,則會造成合成產率的下降,從而使得成本大大增加。因此,采用高效的糾錯編碼技術降低DNA存儲系統的合成成本也是一個重要方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810573636.3/2.html,轉載請聲明來源鉆瓜專利網。





