[發(fā)明專利]用于DNA數(shù)據(jù)存儲的編解碼方法和編解碼裝置有效
| 申請?zhí)枺?/td> | 202011343923.9 | 申請日: | 2020-11-25 |
| 公開(公告)號: | CN112382340B | 公開(公告)日: | 2022-11-15 |
| 發(fā)明(設(shè)計(jì))人: | 黃小羅;戴俊彪 | 申請(專利權(quán))人: | 中國科學(xué)院深圳先進(jìn)技術(shù)研究院 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B40/00;G16B50/50 |
| 代理公司: | 深圳中一聯(lián)合知識產(chǎn)權(quán)代理有限公司 44414 | 代理人: | 黃志云 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 dna 數(shù)據(jù) 存儲 解碼 方法 裝置 | ||
1.一種用于DNA數(shù)據(jù)存儲的二進(jìn)制信息到堿基序列的編解碼方法,其特征在于,所述方法包括:
利用基準(zhǔn)堿基組代表基準(zhǔn)二進(jìn)制單元,構(gòu)建基于基準(zhǔn)堿基組-基準(zhǔn)二進(jìn)制單元的映射編碼規(guī)則庫,其中,所述基準(zhǔn)堿基組的堿基數(shù)為M,所述二進(jìn)制單元的比特?cái)?shù)為2M,且M為大于或等于2的整數(shù),所述編碼規(guī)則庫大于等于20922789888000種;
獲取待編碼的二進(jìn)制數(shù)據(jù),所述二進(jìn)制數(shù)據(jù)包括多個(gè)二進(jìn)制單元;
采用N個(gè)不同的映射編碼規(guī)則對所述多個(gè)二進(jìn)制單元進(jìn)行編碼,得到與所述二進(jìn)制數(shù)據(jù)對應(yīng)的堿基序列,其中,N為大于或等于2的整數(shù),所述堿基序列用于合成存儲有與所述二進(jìn)制數(shù)據(jù)對應(yīng)的數(shù)據(jù)信息的DNA;所述N個(gè)不同的映射編碼規(guī)則選自所述基準(zhǔn)堿基組-基準(zhǔn)二進(jìn)制單元的映射編碼規(guī)則庫中的規(guī)則;
所述采用N個(gè)不同的映射編碼規(guī)則對所述多個(gè)二進(jìn)制單元進(jìn)行編碼,包括:
按照各個(gè)二進(jìn)制單元的順序,采用對應(yīng)編號的映射編碼規(guī)則進(jìn)行編碼;
或者,對二進(jìn)制數(shù)據(jù)中的相鄰的兩個(gè)二進(jìn)制單元,采用不同的映射編碼規(guī)則進(jìn)行編碼,具體為:所述多個(gè)二進(jìn)制單元包括p個(gè)二進(jìn)制單元,其中,第一二進(jìn)制單元采用第一映射編碼規(guī)則,第二二進(jìn)制單元采用除第一映射編碼規(guī)則之外的任意一個(gè)映射編碼規(guī)則,第三二進(jìn)制單元采用除第二二進(jìn)制單元采用的映射編碼規(guī)則之外的任意一個(gè)映射編碼規(guī)則,直到第p二進(jìn)制單元采用除第p-1二進(jìn)制單元采用的映射編碼規(guī)則之外的任意一個(gè)映射編碼規(guī)則;p為大于3的整數(shù);
或者,所述二進(jìn)制數(shù)據(jù)包括多條二進(jìn)制子數(shù)據(jù),把多條二進(jìn)制子數(shù)據(jù)按照預(yù)設(shè)的規(guī)則混編成一條二進(jìn)制數(shù)據(jù)后,再對混編后的二進(jìn)制數(shù)據(jù)采用編碼規(guī)則進(jìn)行編碼,具體為:
2條二進(jìn)制子數(shù)據(jù)分別標(biāo)記為第一二進(jìn)制子數(shù)據(jù)和第二二進(jìn)制子數(shù)據(jù),按2bits作為一個(gè)單元將第一二進(jìn)制子數(shù)據(jù)和第二二進(jìn)制子數(shù)據(jù)劃分成多個(gè)子單元,并對子單元進(jìn)行排序;將第一二進(jìn)制子數(shù)據(jù)和第二二進(jìn)制子數(shù)據(jù)中相同排序位的子單元進(jìn)行合并,將兩條二進(jìn)制子數(shù)據(jù)整合成第三二進(jìn)制數(shù)據(jù);
按4bits作為一個(gè)單元將第三二進(jìn)制數(shù)據(jù)劃分成多個(gè)二進(jìn)制單元,對二進(jìn)制單元進(jìn)行奇數(shù)和偶數(shù)排序后,采用第一映射編碼規(guī)則對位于奇數(shù)排位的二級制單元進(jìn)行編碼,采用第二映射編碼規(guī)則對位于偶數(shù)排位的二進(jìn)制單元進(jìn)行編碼,得到堿基序列;其中,對于待轉(zhuǎn)化的二進(jìn)制數(shù)據(jù)末尾不足一個(gè)二進(jìn)制單元時(shí),用0或1補(bǔ)齊后再進(jìn)行編碼;
所述方法還包括:
根據(jù)DNA合成技術(shù)能夠合成的長度,將編碼得到的堿基序列拆分成J個(gè)序列小片段,J為大于且小于200nt的正整數(shù);
堿基子序列設(shè)置有索引標(biāo)記,用于標(biāo)記堿基子序列在堿基序列中的位置,所述索引標(biāo)記添加在拆分的小片段左邊或者右邊;且在拆分的J個(gè)序列小片段兩端還加上16-25個(gè)堿基的接頭序列;且在拆分的J個(gè)序列小片段中加入糾錯(cuò)碼,所述糾錯(cuò)碼包括Reed-Solomon、漢明碼;
對合成的所述DNA進(jìn)行解碼時(shí),通過測序從合成的所述DNA中獲取所述堿基序列;其中,使用引物對合成的DNA進(jìn)行擴(kuò)增;
根據(jù)所述N個(gè)不同的映射編碼規(guī)則解碼所述堿基序列,得到所述二進(jìn)制數(shù)據(jù),包括:所述堿基序列包括多個(gè)堿基組,所述堿基組與所述二進(jìn)制單元相對應(yīng);采用所述N個(gè)不同的映射編碼規(guī)則對所述堿基組進(jìn)行解碼,得到與所述堿基序列對應(yīng)的所述二進(jìn)制數(shù)據(jù);
當(dāng)所述堿基序列包括J個(gè)堿基子序列時(shí),所述通過測序從合成的所述DNA中獲取所述堿基序列,包括:
通過測序從合成的所述DNA中獲取J個(gè)堿基子序列;
將所述J個(gè)堿基子序列拼接為所述堿基序列;
所述堿基子序列設(shè)置有索引標(biāo)記,所述將所述J個(gè)堿基子序列拼接為所述堿基序列,包括:
根據(jù)所述索引標(biāo)記,確定所述堿基子序列在所述堿基序列中的位置;
按照所述堿基子序列在所述堿基序列中的位置,將所述J個(gè)堿基子序列拼接為所述堿基序列。
2.如權(quán)利要求1所述的用于DNA數(shù)據(jù)存儲的二進(jìn)制信息到堿基序列的編解碼方法,其特征在于,所述多個(gè)二進(jìn)制單元中相隔N-1個(gè)二進(jìn)制單元的兩個(gè)二進(jìn)制單元采用所述N個(gè)不同的映射編碼規(guī)則中的同一個(gè)映射編碼規(guī)則進(jìn)行編碼。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院深圳先進(jìn)技術(shù)研究院,未經(jīng)中國科學(xué)院深圳先進(jìn)技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011343923.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:病死動物尸體儲存冷庫
- 下一篇:一種高抗拉強(qiáng)度的銅合金鑄造工藝
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





