[發(fā)明專利]全基因組重測序分析及用于全基因組重測序分析的方法有效
| 申請?zhí)枺?/td> | 201910989715.7 | 申請日: | 2019-10-17 |
| 公開(公告)號: | CN110797088B | 公開(公告)日: | 2020-09-15 |
| 發(fā)明(設計)人: | 張凱;沈一鳴 | 申請(專利權)人: | 南京醫(yī)基云醫(yī)療數(shù)據(jù)研究院有限公司 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B20/00;G16B50/30 |
| 代理公司: | 北京律智知識產(chǎn)權代理有限公司 11438 | 代理人: | 袁禮君;孫寶海 |
| 地址: | 210000 江蘇省南京市江北新區(qū)*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因組 重測序 分析 用于 方法 | ||
本發(fā)明公開一種全基因組重測序分析及用于全基因組重測序分析的方法。所述用于全基因組重測序分析的方法包括:獲取對待檢測樣本的DNA序列進行識別所得到的多條測序序列;將所述多條測序序列分成多個測序序列組;基于每個測序序列組,并行地執(zhí)行如下操作:依次地或并行地將所述測序序列組中的各條測序序列與參考基因組進行測序序列對比,確定每條測序序列在所述參考基因組上的對應位置及對應的染色體編號;以及根據(jù)每條測序序列在所述參考基因組上的對應位置及對應的染色體編號,對各條測序序列進行排序和去重,生成對應各染色體的測序序列庫。
技術領域
本發(fā)明涉及基因測序領域,具體而言,涉及一種全基因組重測序分析及用于全基因組重測序分析的方法。
背景技術
全基因組重測序是指對具備參考基因組的物種中的不同個體進行基因組測序,并識別出樣本個體基因與參考基因組的差別。隨著大眾對人類基因組認知水平的提高,全基因組重測序在醫(yī)學、鑒定等領域發(fā)揮著越來越重要的作用。
現(xiàn)階段,全基因組重測序包括實驗和數(shù)據(jù)分析兩大步驟:1)使用二代測序儀,將輸入樣本的DNA序列識別為測序序列;2)通過數(shù)理統(tǒng)計方法,確定二代測序儀輸出的測序序列與參考基因組之間的差異。
對于步驟2),目前通常采用BWA、Samtools、GATK等開源軟件分別完成全基因組重測序數(shù)據(jù)分析所需的測序序列對比、排序、去重、質量值校正及變異識別等標準流程。然而,只有BWA和Samtools軟件具有并行化處理能力,其它標準流程所使用的軟件均為串行工具,其數(shù)據(jù)處理時間長,難以充分利用多核CPU資源。
此外,由于全基因重測序的每一流程均由不同的軟件實現(xiàn),軟件與軟件之間將存在大量需要輸出至硬盤的中間文件,且全基因重測序的數(shù)據(jù)處理極為密集:以目前研究最多的人類全基因組重測序為例,其產(chǎn)生的中間文件總計將超過300G。為了減小中間文件,前一軟件輸出中間文件時往往對其進行特定格式的壓縮,后一軟件輸入中間文件時需要對其進行解壓。如此大量中間文件的頻繁讀寫也將嚴重降低準備測序序列庫和數(shù)據(jù)分析的速度與效率。
在所述背景技術部分公開的上述信息僅用于加強對本發(fā)明的背景的理解,因此它可以包括不構成對本領域普通技術人員已知的現(xiàn)有技術的信息。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種用于全基因組重測序分析的方法、全基因組重測序分析方法、裝置、電子設備及計算機可讀存儲介質。
本發(fā)明的其他特性和優(yōu)點將通過下面的詳細描述變得顯然,或部分地通過本發(fā)明的實踐而習得。
根據(jù)本發(fā)明的一方面,提供一種用于全基因組重測序分析的方法,包括:獲取對待檢測樣本的DNA序列進行識別所得到的多條測序序列;將所述多條測序序列分成多個測序序列組;基于每個測序序列組,并行地執(zhí)行如下操作:依次地或并行地將所述測序序列組中的各條測序序列與參考基因組進行測序序列對比,確定每條測序序列在所述參考基因組上的對應位置及對應的染色體編號;以及根據(jù)每條測序序列在所述參考基因組上的對應位置及對應的染色體編號,對各條測序序列進行排序和去重,生成對應各染色體的測序序列庫
根據(jù)本發(fā)明的一實施方式,根據(jù)每條測序序列在所述參考基因組上的對應位置及對應的染色體編號,對各條測序序列進行排序和去重,生成對應各染色體的測序序列庫包括:基于每個測序序列組,并行地執(zhí)行如下操作:根據(jù)所述測序序列組中各條測序序列對應的染色體編號,確定每條測序序列的所屬染色體;以及基于每個染色體,并行地執(zhí)行如下操作:根據(jù)所述染色體中各條測序序列在所述參考基因組上的對應位置,依次地對各條測序序列進行排序和去重,生成對應所述染色體的測序序列庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京醫(yī)基云醫(yī)療數(shù)據(jù)研究院有限公司,未經(jīng)南京醫(yī)基云醫(yī)療數(shù)據(jù)研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910989715.7/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





