[發(fā)明專利]一種基于高通量測序的DNA標簽文庫構建方法有效
| 申請?zhí)枺?/td> | 201010299271.3 | 申請日: | 2010-09-21 |
| 公開(公告)號: | CN102409048A | 公開(公告)日: | 2012-04-11 |
| 發(fā)明(設計)人: | 章文蔚;張艷艷;于競;田方;陳海燕;龔梅花;周妍 | 申請(專利權)人: | 深圳華大基因科技有限公司;深圳華大基因研究院 |
| 主分類號: | C12N15/11 | 分類號: | C12N15/11;C40B40/06;C40B50/06 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 羅菊華 |
| 地址: | 518083 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 通量 dna 標簽 文庫 構建 方法 | ||
技術領域
本發(fā)明涉及核酸測序技術領域,特別是高通量測序技術領域。另外,本發(fā)明還涉及標簽技術,以及實現(xiàn)多個樣品在同一反應體系中進行構建標簽文庫的方法。本發(fā)明的方法特別適用于第二代測序技術,尤其是solexa測序技術。
背景技術
Illumina公司提供的Solexa?DNA測序平臺,可在一個反應中同時加入四種帶熒光標記的核苷酸,采用邊合成邊測序(Sequencing?BySynthesis,SBS),具有所需樣品量少,高通量,高精確性,擁有簡單易操作的自動化平臺和功能強大等特點[1-4]。文庫構建首先需要將目的片段進行末端修復,在目的片段的3’末端連接A堿基,將3’末端帶有“A”堿基的目的片段與DNA接頭連接,通過PCR反應將目的片段進行擴增,最后回收含有DNA接頭的目的片段文庫,見圖1。目的片段文庫與測序芯片上面的DNA接頭進行雜交,通過橋式PCR進行擴增后,最后邊合成邊測序。在每個循環(huán)過程里,熒光標記的核苷和聚合酶被加入到單分子陣列中?;パa的核苷和核苷酸片斷的第一個堿基配對,通過酶加入到引物上。多余的核苷被移走。這樣每個單鏈DNA分子通過互補堿基的配對被延伸,針對每種堿基的特定波長的激光激發(fā)結合上的核苷的標記,這個標記會釋放出熒光,最后收集到的熒光信號來翻譯成堿基序列。目前這種DNA建庫方法可以根據(jù)需求運用于各種研究領域,如基因組的De?Novo測序,基因組重測序、轉錄組測序和表觀基因組測序等。
基于上述建庫方法illumina公司也推出了DNA標簽(也稱為index)建庫方法,如圖2所示。在DNA標簽建庫流程中,PCR過程使用了3條PCR標簽引物,通過PCR導入標簽來構建DNA標簽文庫[5]。專利申請WO2005068656A1和WO2008093098A2中公開了一種使用標簽序列標記核酸樣品的來源從而可以將樣品進行混合測序的方法,可以通過PCR的過程將特定的核苷酸序列(標簽序列)通過PCR導入到文庫中,PCR標簽引物序列見表1。這些帶有標簽的文庫可以根據(jù)需求進行任意混合,然后通過solexa測序儀器進行測序,最后將數(shù)據(jù)按標簽標簽序列進行分類。
但是illumina公司提供的標簽文庫制備的方法存在著一些缺陷:第一、目前illumina公司只提供12個長度為6bp的標簽序列,標簽的數(shù)量較少,隨著solexa測序通量的增加,不能對大量樣本進行混合測序將是一個巨大的缺陷;第二、目前illumina公司提供的標簽建庫方法是通過PCR反應將標簽序列導入到目的片段文庫中,需要3條PCR引物對目的片段進行擴增(兩條公用引物和一條PCR標簽引物,如表1),而且PCR擴增效率不高。
在標簽混合量少于12個樣品的情況下,必須考慮到混合后的標簽上的每個堿基位點的GT含量。因為solexa測序過程中,堿基G和T的激發(fā)熒光一樣,堿基A和C的激發(fā)光是一樣的,因此必須考慮堿基“GT”含量與堿基“AC”含量的“平衡”,最適堿基“GT”含量為50%,能保證標簽識別率最高。
因此將標簽引物進行優(yōu)化和改進就十分必要了,不僅能提高文庫制備的效率和標簽的識別率,也能提高目前DNA樣品的測序通量,極大的降低了單個文庫的測序費用。
表1illumina公司提供的標簽序列及PCR標簽引物(indexN?PCR引物)序列
發(fā)明內容
基于目前illumina公司的solexa測序平臺提供的DNA標簽文庫制備方法,本發(fā)明改良了index序列,分別設計了長度為7bp獨特的index序列,可以通過接頭連接和PCR反應導入組合標簽序列,成功的建立了DNA標簽文庫的建庫方法,并應用于solexa?DNA測序,提高了DNA標簽文庫的制備的效率,極大的增大了DNA樣品的測序通量,降低了單個樣品的solexa測序費用。
標簽設計首先需要考慮標簽序列之間的可識別性和識別率的問題,然后需要考慮標簽序列混合之后的每個位點的GT與AC堿基含量的平衡問題,最后考慮數(shù)據(jù)產出的可重復性和準確性。在設計標簽的過程中,本發(fā)明充分考慮到以上幾個因素,同時避免了標簽的核酸序列出現(xiàn)3或3個以上連續(xù)的堿基,這樣可以降低序列在合成過程中或測序過程中的錯誤率。同時盡量避免標簽引物自身形成發(fā)夾結構,而導致PCR反應擴增效率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技有限公司;深圳華大基因研究院,未經深圳華大基因科技有限公司;深圳華大基因研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010299271.3/2.html,轉載請聲明來源鉆瓜專利網。





