[發明專利]Pacbio三代測序數據的處理方法在審
| 申請號: | 202010328589.3 | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111429967A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 田仕林;王雪涵;曹麗蓉 | 申請(專利權)人: | 北京諾禾致源科技股份有限公司;北京諾禾致源生物科技有限公司;天津諾禾致源生物信息科技有限公司;天津諾禾醫學檢驗所有限公司;南京諾禾致源生物科技有限公司 |
| 主分類號: | G16B20/10 | 分類號: | G16B20/10;G16B20/20;G16B30/10;G16B40/00 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 梁文惠 |
| 地址: | 102200 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | pacbio 三代測 序數 處理 方法 | ||
本發明公開了一種Pacbio三代測序數據的處理方法。該處理方法包括:通過程序對來自Pacbio三代測序系統的測序數據進行處理,其中,程序的輸入包括測序數據,程序調用至少一個工具對測序數據進行處理,其中,程序在調用至少一個工具之前,將需要輸入到至少一個工具的數據配置為該工具相匹配的格式;程序將格式匹配之后的數據作為輸入數據輸入到至少一個工具。應用本發明的技術方案,建成一整套自動化Pacbio三代測序數據分析流程,從而方便快捷的完成對Pacbio基因組重測序數據的分析,解決了現有技術中對三代測序的結果文件進行人工整理耗時長,效率低的技術問題。
技術領域
本發明涉及生物信息技術領域,具體而言,涉及一種Pacbio三代測序數據的處理方法。
背景技術
基因組是生物體細胞內所有遺傳信息,以核苷酸形式儲存。對基因組的高通量測序,能夠更加深入的研究生物的各種遺傳信息,對解密基因與性狀的關系具有重要作用?,F階段高通量測序技術很多類型,其中,以單分子實時(SMRT)測序技術為原理的Pacbio測序讀長長,通量高,能夠保證均勻的覆蓋度。測序數據的增多也增加了數據需要高效分析的需求。
目前,已有關于對二代測序數據進行自動化分析的方法,但對三代數據的分析還需要人工對每一步進行整理及操作。其中,對于Pacbio基因組重測序數據分析步驟比較固定,但需要人工對每一步的結果文件進行整理再銜接下一步工作,耗時長,效率低。
發明內容
本發明旨在提供一種Pacbio三代測序數據的處理方法,以解決現有技術中對三代測序的結果文件進行人工整理耗時長,效率低的技術問題。
為了實現上述目的,根據本發明的一個方面,提供了一種Pacbio三代測序數據的處理方法。該處理方法包括:通過程序對來自Pacbio三代測序系統的測序數據進行處理,其中,程序的輸入包括測序數據,程序調用至少一個工具對測序數據進行處理,其中,程序在調用至少一個工具之前,將需要輸入到至少一個工具的數據配置為該工具相匹配的格式;程序將格式匹配之后的數據作為輸入數據輸入到至少一個工具。
進一步地,程序調用的至少一個工具包括以下至少之一:讀取reads長度的工具、與參考基因組進行比對的工具、對比對后的結果進行處理的工具、檢測結構變異的工具、檢測拷貝數變異的工具、檢測樣本單核苷酸多態性位點與插入缺失位點的工具、對變異類型數目進行統計的工具。
進一步地,程序獲取調用至少一個工具進行處理之后輸出的結果,并根據結果生成報告。
進一步地,程序的輸入至少包括:待處理的數據以及待調用的工具,其中,程序調用待調用的工具對待處理的數據進行處理。
進一步地,程序依次調用與參考基因組進行比對的工具、對比對后的結果進行處理的工具、檢測結構變異的工具、檢測拷貝數變異的工具、檢測樣本單核苷酸多態性位點與插入缺失位點的工具、以及對變異類型數目進行統計的工具,程序在調用下一個工具之前,將上一個工具的輸出配置為與下一個工具相匹配的格式,并輸入到下一個工具。
進一步地,程序將調用的每個工具生成的結果文件保存至一個目錄。
進一步地,程序被運行之后可生成一個投遞任務的腳本,投遞至SGE任務系統。
進一步地,讀取reads長度的工具為samtools;和/或,與參考基因組進行比對的工具為ngmlr和pbsmrtpipe;和/或,對比對后的結果進行處理的工具為samtools和pbsmrtpipe;和/或,檢測結構變異的工具為sniffles;和/或,檢測拷貝數變異的工具為control-freec;和/或,檢測樣本單核苷酸多態性位點與插入缺失位點的工具pbsmrtpipe;和/或,對變異類型數目進行統計的工具annovar。
進一步地,程序為perl語言及shell語言。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京諾禾致源科技股份有限公司;北京諾禾致源生物科技有限公司;天津諾禾致源生物信息科技有限公司;天津諾禾醫學檢驗所有限公司;南京諾禾致源生物科技有限公司,未經北京諾禾致源科技股份有限公司;北京諾禾致源生物科技有限公司;天津諾禾致源生物信息科技有限公司;天津諾禾醫學檢驗所有限公司;南京諾禾致源生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010328589.3/2.html,轉載請聲明來源鉆瓜專利網。





