[發明專利]一種使用DNA字符碼存儲文字點陣的方法在審
| 申請號: | 202010588960.X | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111737955A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 任兆瑞 | 申請(專利權)人: | 任兆瑞 |
| 主分類號: | G06F40/126 | 分類號: | G06F40/126;G06F40/157;G06F40/242;G16B50/00 |
| 代理公司: | 江蘇法德東恒律師事務所 32305 | 代理人: | 劉林 |
| 地址: | 276100 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 dna 字符 存儲 文字 點陣 方法 | ||
本發明公開了一種使用DNA字符碼存儲文字點陣的方法,方法首先將文字或字符點陣使用一段長度為N個堿基的DNA字符碼表示,字符碼為N+1的形式,其最后一位為根據其前面的N個堿基統計計算得到的校驗碼,所得字符碼添加到其對應的文字或字符點陣的開頭和末尾,并添加到字典中,文字點陣存儲則直接使用方法所生成的帶有校驗碼的字符碼進行;采用本發明的文字點陣存儲方法,不僅能夠避免文字點陣DNA存儲方法容易產生大段的重復DNA序列的不足,同時,采用了較短長度的DNA字符碼取代文字點陣記錄文字信息,極大地提高了存儲密度。
技術領域
本發明公開了一種使用DNA字符碼存儲文字點陣的方法,屬于生物技術與信息技術領 域。
背景技術
DNA是重要的遺傳物質載體,是自然界生物通過數十億年進化而產生的一種線形或環形 的雙螺旋生物大分子。上世紀五十年代,DNA作為生物的遺傳信息載體被科學家證實,與普 通信息存儲載體相比,DNA在數據存儲方面有其獨有的天然優勢:存儲密度高,1克DNA 可以保存世界上的所有書籍內容;存儲穩定且時間久,能夠達到幾萬年到幾百萬年;攜帶方 便,能夠由細菌或者生物體內生物攜帶或置于容器長期保存等。
傳統存儲介質中,紙張等主要用圖形文字等來表示,光盤等信息載體使用二進制電信號 0/1來表示,而DNA則是用A/T/G/C四個堿基依次排列實現,不同的序列代表不同的信息, 相當于是四進制。一般在生物體的DNA中,A/T/G/C堿基的分布和比例需要均勻并且盡量減 少大段的重復,而基于文字點陣進行DNA存儲時,每個文字的DNA序列均會包括上百個堿 基,不同的漢字其點陣可能會包含有許多相同的片段,從而產生較多的重復DNA片段;同 時,基于文字點陣進行DNA存儲時,相同的漢字會產生相同的DNA序列,對于一些出現頻率較高的文字或字符,也會產生較多的重復DNA序列,這些普遍存在的重復DNA序列都會 極大的影響DNA的復制與合成。
發明內容
發明要解決的技術問題
為解決現有文字點陣DNA存儲時會產生較多重復序列,影響其復制合成的問題,本發 明提出一種使用DNA字符碼存儲文字點陣的方法。
技術方案
為解決上述技術問題,本發明采用以下技術方案:
一種使用DNA字符碼存儲文字點陣的方法,包括以下步驟:
步驟1,面向字庫中的每個文字或字符的點陣隨機生成一段長度為N的DNA堿基作為字 符碼;
步驟2,為生成字符碼的二進制碼生成校驗碼并添加到字符碼的末尾,生成長度為8-10 個DNA堿基的字符碼;
步驟3,將上一步中所得的字符碼添加到其對應的文字或字符點陣的開頭和末尾,并添加 到字典中;
步驟4,使用步驟2所得的DNA字符碼對文字點陣進行存儲。
進一步地,步驟2中的校驗碼為一個DNA堿基,校驗碼二進制碼首位的生成方法為:統 計字符碼二進制碼中奇數位“1”的個數,個數為奇數則為1,偶數則為0;校驗碼二進制碼次位的生成方法為:統計字符碼二進制碼中偶數位“1”的個數,個數為奇數則為1,偶數則為0。
進一步地,為避免重復,對于經常使用的文字或字符的點陣生成多個字符碼。
有益效果
采用本發明提供的技術方案,與現有技術相比,具有如下有益效果:
本發明存儲方法能夠避免產生大段的重復DNA序列,克服了文字點陣DNA存儲方法的 不足;
本發明采用較短長度的DNA字符碼記錄文字信息,極大地提高了存儲密度;
本發明存儲方法原理步驟簡單,便于在本技術領域推廣應用。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于任兆瑞,未經任兆瑞許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010588960.X/2.html,轉載請聲明來源鉆瓜專利網。





