[發(fā)明專利]一種二代序列基因組重疊群的組裝方法和系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710214128.1 | 申請(qǐng)日: | 2017-04-01 |
| 公開(公告)號(hào): | CN108660197A | 公開(公告)日: | 2018-10-16 |
| 發(fā)明(設(shè)計(jì))人: | 鄧天全;高強(qiáng);楊林峰;楊鑫;盛琴;陳世璇;岳震;霍守江;肖黎 | 申請(qǐng)(專利權(quán))人: | 深圳華大基因科技服務(wù)有限公司 |
| 主分類號(hào): | C12Q1/6869 | 分類號(hào): | C12Q1/6869;C40B40/08;C12M1/34 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 鞏克棟 |
| 地址: | 518083 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 重疊群 基因組 組裝 末端測(cè)序 拼接 文庫(kù) 超聲 建庫(kù) 切膠 打斷 片段凝膠純化 插入片段 拼接軟件 序列組裝 延長(zhǎng)序列 重疊關(guān)系 重疊區(qū)域 測(cè)序 構(gòu)建 | ||
1.一種二代序列基因組重疊群的組裝方法,其特征在于,包括如下步驟:
(1)提取樣品基因組并超聲打斷;
(2)將步驟(1)超聲打斷的片段凝膠純化并切膠,以構(gòu)建不同插入片段的文庫(kù);
(3)將步驟(2)得到的文庫(kù)進(jìn)行二代雙末端測(cè)序;
(4)將各個(gè)文庫(kù)的二代雙末端測(cè)序的讀1和讀2進(jìn)行拼接;
(5)將拼接后的序列進(jìn)行序列組裝;
其中,所述二代雙末端測(cè)序的讀1和讀2的序列有5bp以上的重疊區(qū)域。
2.根據(jù)權(quán)利要求1所述的組裝方法,其特征在于,步驟(1)所述超聲打斷的范圍為100-500bp,步驟(2)所述切膠的長(zhǎng)度范圍為450-500bp;
優(yōu)選地,步驟(1)所述超聲打斷的范圍為100-600bp,步驟(2)所述切膠的長(zhǎng)度范圍為550-600bp。
3.根據(jù)權(quán)利要求1或2所述的組裝方法,其特征在于,所述二代雙末端測(cè)序的讀1和讀2的讀長(zhǎng)長(zhǎng)度為200-2000bp,優(yōu)選為200-500bp,進(jìn)一步優(yōu)選為250-300bp。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的組裝方法,其特征在于,所述二代雙末端測(cè)序的讀1和讀2的序列有5bp以上的重疊區(qū)域。
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的組裝方法,其特征在于,所述步驟(3)和步驟(4)之間還包括將步驟(3)所述的二代雙末端測(cè)序進(jìn)行數(shù)據(jù)過濾。
6.根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的組裝方法,其特征在于,所述數(shù)據(jù)過濾具體包括:去除含接頭和低質(zhì)量的序列。
7.根據(jù)權(quán)利要求1-6中任一項(xiàng)所述的組裝方法,其特征在于,步驟(4)所述的拼接采用PEAR軟件進(jìn)行對(duì)比拼接;
優(yōu)選地,步驟(5)所述的序列組裝采用CABOG、Celera、Newbler或Shorty Edena中的任意一種軟件。
8.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的組裝方法,其特征在于,所述方法包括如下步驟:
(1)提取樣品基因組并超聲打斷;
(2)將步驟(1)超聲打斷的片段凝膠純化并切膠,以構(gòu)建不同插入片段的文庫(kù);
(3)將步驟(2)得到的文庫(kù)采用測(cè)序儀進(jìn)行二代雙末端測(cè)序,所述二代雙末端測(cè)序的讀1和讀2的讀長(zhǎng)長(zhǎng)度為250-2000bp,所述讀1和讀2的序列有5bp以上的重疊區(qū)域;
(4)將步驟(3)所述的二代雙末端測(cè)序進(jìn)行去除含接頭和低質(zhì)量的序列的數(shù)據(jù)過濾;
(5)將各個(gè)文庫(kù)的二代雙末端測(cè)序的讀1和讀2采用PEAR軟件進(jìn)行拼接;
(6)將拼接后的序列采用CABOG、Celera、Newbler或Shorty Edena中的任意一種軟件進(jìn)行序列組裝。
9.一種二代序列基因組重疊群的系統(tǒng),其特征在于,包括依次連接的如下組件:建庫(kù)模塊,測(cè)序模塊、拼接模塊和重疊群組裝模塊。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述建庫(kù)模塊用于將樣品DNA超聲打斷后凝膠純化并切膠,以構(gòu)建不同插入片段的文庫(kù);
優(yōu)選地,所述測(cè)序模塊用于對(duì)構(gòu)建的文庫(kù)進(jìn)行二代雙末端測(cè)序和數(shù)據(jù)過濾;
優(yōu)選地,所述拼接模塊用于對(duì)二代雙末端測(cè)序的讀1和讀2進(jìn)行拼接;
優(yōu)選地,所述重疊群組裝模塊用于對(duì)拼接后的序列進(jìn)行序列組裝。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳華大基因科技服務(wù)有限公司,未經(jīng)深圳華大基因科技服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710214128.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 減毒的人-牛嵌合呼吸道合胞病毒疫苗的生產(chǎn)
- 減毒的人-牛嵌合呼吸道合胞病毒疫苗的生產(chǎn)
- 用于對(duì)基因組進(jìn)行壓縮和解壓縮的方法和裝置
- 一種基因組重測(cè)序分析系統(tǒng)及方法
- 病原微生物基因組數(shù)據(jù)庫(kù)及其建立方法
- 宏基因組的重組裝方法、重組裝裝置及終端設(shè)備
- 用于保存和使用基因組及基因組數(shù)據(jù)的方法
- 識(shí)別胚胎中染色體異常的系統(tǒng)和方法
- 菌株基因組注釋查詢方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 真菌基因組測(cè)序數(shù)據(jù)自動(dòng)分析方法及系統(tǒng)
- 配對(duì)末端測(cè)序
- 配對(duì)末端測(cè)序法
- 一種測(cè)序文庫(kù)及其制備方法、一種末端測(cè)序方法和裝置
- DNA標(biāo)簽及其在構(gòu)建和測(cè)序配對(duì)末端標(biāo)簽文庫(kù)中的應(yīng)用
- 同時(shí)對(duì)多種核酸樣本進(jìn)行測(cè)序的方法
- 用于核酸配對(duì)末端測(cè)序的方法、組合物、系統(tǒng)、儀器和試劑盒
- 一種BAC末端測(cè)序的方法
- 提高DNB雙末端測(cè)序質(zhì)量的方法和DNB雙末端測(cè)序方法和試劑盒
- 用于核酸配對(duì)末端測(cè)序的方法、組合物、系統(tǒng)、儀器和試劑盒
- 一種長(zhǎng)片段DNA文庫(kù)長(zhǎng)配對(duì)末端測(cè)序方法





