[發明專利]一種應用于PacBio長片段文庫構建的BAC載體及其應用在審
| 申請號: | 201911303067.1 | 申請日: | 2019-12-17 |
| 公開(公告)號: | CN110938646A | 公開(公告)日: | 2020-03-31 |
| 發明(設計)人: | 方濤 | 申請(專利權)人: | 武漢菲沙基因信息有限公司 |
| 主分類號: | C12N15/70 | 分類號: | C12N15/70;C12Q1/6869;C12Q1/6806;C40B50/06;C40B40/06 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 周瓊 |
| 地址: | 430000 湖北省武漢市東湖高新技術開發區高新*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 pacbio 片段 文庫 構建 bac 載體 及其 應用 | ||
本發明提供一種應用于PacBio長片段文庫構建的BAC載體及其應用。該BAC載體結構經特殊設計,其骨架大小要求在20kb以下,可使載體方便高效的轉染至細菌中并進行大量復制;酶切位點為8堿基及以上的酶切位點,且除兩端的酶切位點外,骨架上不存在其它的酶切位點,從而保證內切酶酶切打斷環形BAC質粒DNA時,不會切在BAC骨架上;載體兩端連接的標簽序列,使酶切獲得的每個插入片段上帶有特異的Barcode序列,可以識別測序數據來源于哪一個BAC。本發明結合特殊設計的BAC質粒骨架與PacBio測序長讀長的優勢,無需參考基因組序列,不僅可以獲得40?60kb的超長插入片段的全長序列,還可以基于特殊設計標簽序列實現批量的BAC測序,可應用于高重復或高復雜的序列測序問題。
技術領域
本發明涉及基因測序領域,更具體地,涉及一種應用于PacBio長片段文庫構建的BAC載體及其應用。
背景技術
基因組是所有生命遺傳物質的集合,為生命行使生物學功能提供指導,基因組中的堿基序列信息記錄著生命進化的歷史。因而,基因組序列的完整解析可極大促進基因功能研究,更為物種相互作用和基因組比較等生命科學研究提供基礎信息。大多數生物的基因組均由A、T、G、C 4種堿基組成,其組合順序和總長度各不相同,如何快速和低成本地獲取基因組序列一直是基因組學領域的重心。由于測序技術或測序儀器的內在缺陷,測序讀長仍小于基因組長度,所以除少數基因組較小的DNA病毒外,絕大多數基因組仍無法通過一次測序直接獲得全部的序列信息,需要通過高覆蓋度測序和序列組裝獲得完整的基因組信息。而復雜基因組指的是無法使用常規測序和組裝手段直接解析的一類基因組,通常指包含高比例重復序列、高雜合度、極端GC含量、存在難消除異源DNA污染的基因組。此外,基因組的端粒區域也非常難被測序到。
基因組組裝是一個復雜的過程。影響組裝效果的因素非常多,除了制定的測序策略、測序數據質量、測序的不均勻性以及所使用的組裝軟件外,基因組自身的原因如重復序列(常見在較大的基因組中)、高雜合、多倍體等因素也會顯著影響到組裝的效果(由于短reads不能跨過較長的重復區域,相似reads無法區別是在那一條染色體上)。在復雜植物基因組中,往往存在高雜合、高重復等特點,而Hiseq Illumina測序技術并不能完全避免GC含量的影響,使得復雜基因組完整組裝分析遇到巨大障礙。
隨著第三代實時單分子測序技術的開發,長度長的特性以及免去GC偏好型的特征,使其在基因組組裝及相關挖掘方面產生巨大推進作用。PacBio三代測序技術,平均讀長為18kb,最大讀長可達60kb,足以滿足大多數長片段的讀取,測序精確度達到Q50(測序深度30×時),對于大片段的拼接具有非常大的優勢,同時超長的測序讀長和均一的測序覆蓋度能夠保證基因組高GC和高重復區域的測序質量。
細菌人工染色體(Bacterial Artificial Chromosome,BAC)文庫是一種大片段基因組DNA文庫,隨著克隆載體的不斷優化,插入片段的轉化率穩定性的不斷提高大片段基因組文庫逐漸成為真核生物基因組研究的關鍵平臺。鑒于BAC載體有裝載大片段DNA的能力,為了解決復雜基因組的測序和組裝問題,本申請提供一種基于酶切片段的PacBio長片段文庫構建方法。
發明內容
針對現有技術中存在的技術問題,本發明提出了一種應用于PacBio長片段文庫構建的BAC載體及其應用,將該載體的特殊結構用于PacBio長片段文庫構建,可應用于高重復或高復雜的序列測序問題。
本發明的第一個目的是提出一種應用于PacBio長片段文庫構建的BAC載體,所述BAC載體骨架為20kb以下;載體骨架兩端各設置一個酶切位點,所述酶切位點序列為8堿基以上;每個酶切位點外測各設置一個特異性Barcode標簽,相同BAC載體骨架兩端的Barcode標簽序列相同。
進一步地,所述每個Barcode標簽序列具有16~20個堿基的特異核苷酸序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢菲沙基因信息有限公司,未經武漢菲沙基因信息有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911303067.1/2.html,轉載請聲明來源鉆瓜專利網。





