[發明專利]代碼生成方法、代碼生成裝置以及計算機可讀存儲介質在審
| 申請號: | 201580042711.8 | 申請日: | 2015-07-31 |
| 公開(公告)號: | CN107155361A | 公開(公告)日: | 2017-09-12 |
| 發明(設計)人: | 陳曉明;M.布拉瓦特;K.蓋德克;I.許特爾 | 申請(專利權)人: | 湯姆遜許可公司 |
| 主分類號: | G06N3/12 | 分類號: | G06N3/12;G11C7/10;G11C13/00;H03M5/14 |
| 代理公司: | 北京市柳沈律師事務所11105 | 代理人: | 呂曉章 |
| 地址: | 法國伊西*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 代碼 生成 方法 裝置 以及 計算機 可讀 存儲 介質 | ||
技術領域
提出了一種代碼生成方法和裝置。特別地,本公開涉及用于將源代碼字映射到目標代碼字(例如適于對用于存儲在合成核酸鏈中的信息進行編碼)的方法和裝置,并且涉及相應的計算機可讀存儲介質。
背景技術
核酸是聚合大分子并且由稱為核苷酸的單體序列組成。每個核苷酸由糖組分、磷酸基團和含氮堿基或核堿基組成。核苷酸的糖組分為脫氧核糖的核酸分子是DNA(脫氧核糖核酸)分子,而核苷酸的糖組分為核糖的核酸分子被稱為RNA(核糖核酸)分子。DNA和RNA是出現在生物體中的生物聚合物。
核酸分子被組裝為核苷酸的串或鏈。可以人工生成核酸分子,并且它們的串結構可以用于對任何種類的用戶數據進行編碼。為了在合成的、即人工創建的DNA或RNA中存儲數據,通常生成短DNA或RNA片段(低聚核苷酸,短:寡核苷酸)。利用這些核酸片段,可以實現數據存儲系統,其中數據存儲在核酸分子中。合成的核酸分子攜帶由形成核酸分子的一連串不同核苷酸所編碼的信息。每個合成的核酸分子由通過使用合成器的生物化學處理所生成的核苷酸的序列或串組成,并且表現寡核苷酸或核酸片段,其中核苷酸的序列或級聯對與信息單元的集合(例如,用戶數據的信息位的集合)相對應的代碼字序列進行編碼。例如,在DNA存儲系統中生成短DNA片段。可以存儲這些分子,并且可以通過使用測序器讀取核苷酸序列來從存儲的分子中取回信息。
測序是確定特定核酸片段內的核苷酸的順序的處理。測序可以解釋為讀取處理。核苷酸的讀出順序被處理或解碼以恢復存儲在核酸片段中的原始信息。
在該背景下,術語“核酸片段”、“低聚核苷酸”和“寡核苷酸”可互換地使用并且指代短核酸鏈。該背景下的術語“短”應理解為與天然DNA的長度相比是短的,該天然DNA對生物體使用的遺傳指令進行編碼并且可以由數百萬個核苷酸組成。合成的寡核苷酸可以包含多于一個(例如多于百個,例如在100與300之間,或者幾千個)核苷酸。
該技術使得能夠提供數據存儲系統,其中寫入處理基于作為對要存儲的信息進行編碼的核苷酸序列的核酸片段的創建。
生成的核酸片段例如作為固體物質或者溶解于液體中而存儲在核酸存儲容器中。核酸存儲的特性可以取決于存儲的數據的量和在將發生數據的讀出之前的預期時間。
合成的DNA或RNA中的數字信息存儲可以提供高容量、低維護的信息存儲。
已經在“Next-generation digital information storage”,Church等人,科學(Science)第337卷,第1628頁,2012年和“Towards practical,high-capacity,low-maintenance information storage in synthesized DNA”,Goldman等人,自然(Nature),第494卷,2013年中研究了DNA存儲。
數據可以是要存儲的任何種類的有序數字源數據(例如二進制或四進制代碼符號的序列),對應于數字(例如二進制)編碼的信息,諸如文本、圖像、音頻或視頻數據。由于有限的寡核苷酸長度,數據通常分布到多個寡核苷酸。
在這樣的核酸存儲系統中,寡核苷酸經歷幾個處理階段:合成寡核苷酸,即創建要存儲的核酸鏈,擴增寡核苷酸,即增加每個單寡核苷酸的數目,例如增加到幾百個或數千個,以及測序寡核苷酸,即分析每個寡核苷酸的核苷酸序列。這些處理階段可能經歷錯誤,導致不可解碼或者不正確解碼的信息。
DNA鏈由通過它們各自的核堿基或含氮堿基識別的四種不同的核苷酸組成,即腺嘌呤、胸腺嘧啶、胞嘧啶和鳥嘌呤,分別簡稱為A、T、C和G。RNA鏈也由通過它們各自的核堿基識別的四種不同的核苷酸組成,即腺嘌呤、尿嘧啶、胞嘧啶和鳥嘌呤,分別簡稱為A、U、C和G。
信息被存儲在核苷酸序列中。作為信息傳輸系統,從信息位到不同核苷酸的這種映射可以解釋為以A、T、C、G作為調制符號(或者分別是A、U、C和G)的調制,其中符號字母表的大小為4。相反,從給定符號元組或目標代碼字到信息位元組或源代碼字的判決規則可以稱為解調。
核堿基傾向于經由氫鍵連接到它們的互補配對物。例如,天然DNA通常顯示雙螺旋結構,其中一條鏈的A連接到另一條鏈的T,并且類似地,C傾向于連接到G。在該背景下,A和T以及C和G被稱為互補。相應地,A與U和G與C形成互補RNA堿基對。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湯姆遜許可公司,未經湯姆遜許可公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580042711.8/2.html,轉載請聲明來源鉆瓜專利網。





