[發明專利]Pacbio三代測序數據的處理方法在審
| 申請號: | 202010328589.3 | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111429967A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 田仕林;王雪涵;曹麗蓉 | 申請(專利權)人: | 北京諾禾致源科技股份有限公司;北京諾禾致源生物科技有限公司;天津諾禾致源生物信息科技有限公司;天津諾禾醫學檢驗所有限公司;南京諾禾致源生物科技有限公司 |
| 主分類號: | G16B20/10 | 分類號: | G16B20/10;G16B20/20;G16B30/10;G16B40/00 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 梁文惠 |
| 地址: | 102200 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | pacbio 三代測 序數 處理 方法 | ||
1.一種Pacbio三代測序數據的處理方法,其特征在于,包括:
通過程序對來自Pacbio三代測序系統的測序數據進行處理,其中,所述程序的輸入包括所述測序數據,所述程序調用至少一個工具對所述測序數據進行處理,其中,所述程序在調用所述至少一個工具之前,將需要輸入到所述至少一個工具的數據配置為該工具相匹配的格式;所述程序將格式匹配之后的數據作為輸入數據輸入到所述至少一個工具。
2.根據權利要求1所述的處理方法,其特征在于,所述程序調用的至少一個工具包括以下至少之一:
讀取reads長度的工具、與參考基因組進行比對的工具、對比對后的結果進行處理的工具、檢測結構變異的工具、檢測拷貝數變異的工具、檢測樣本單核苷酸多態性位點與插入缺失位點的工具、對變異類型數目進行統計的工具。
3.根據權利要求2所述的處理方法,其特征在于,所述程序獲取調用所述至少一個工具進行處理之后輸出的結果,并根據所述結果生成報告。
4.根據權利要求2所述的處理方法,其特征在于,所述程序的輸入至少包括:待處理的數據以及待調用的工具,其中,所述程序調用所述待調用的工具對所述待處理的數據進行處理。
5.根據權利要求2所述的處理方法,其特征在于,所述程序依次調用所述與參考基因組進行比對的工具、所述對比對后的結果進行處理的工具、所述檢測結構變異的工具、所述檢測拷貝數變異的工具、所述檢測樣本單核苷酸多態性位點與插入缺失位點的工具、以及所述對變異類型數目進行統計的工具,所述程序在調用下一個工具之前,將上一個工具的輸出配置為與下一個工具相匹配的格式,并輸入到下一個工具。
6.根據權利要求2所述的處理方法,其特征在于,所述程序將調用的每個工具生成的結果文件保存至一個目錄。
7.根據權利要求1至6中任一項所述的處理方法,其特征在于,所述程序被運行之后可生成一個投遞任務的腳本,投遞至SGE任務系統。
8.根據權利要求2所述的處理方法,其特征在于,
讀取reads長度的工具為samtools;和/或,
與參考基因組進行比對的工具為ngmlr和pbsmrtpipe;和/或,
對比對后的結果進行處理的工具為samtools和pbsmrtpipe;和/或,
檢測結構變異的工具為sniffles;和/或,
檢測拷貝數變異的工具為control-freec;和/或,
檢測樣本單核苷酸多態性位點與插入缺失位點的工具pbsmrtpipe;和/或,
對變異類型數目進行統計的工具annovar。
9.根據權利要求1至6中任一項所述的處理方法,其特征在于,所述程序為perl語言及shell語言。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京諾禾致源科技股份有限公司;北京諾禾致源生物科技有限公司;天津諾禾致源生物信息科技有限公司;天津諾禾醫學檢驗所有限公司;南京諾禾致源生物科技有限公司,未經北京諾禾致源科技股份有限公司;北京諾禾致源生物科技有限公司;天津諾禾致源生物信息科技有限公司;天津諾禾醫學檢驗所有限公司;南京諾禾致源生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010328589.3/1.html,轉載請聲明來源鉆瓜專利網。





