[發明專利]測序數據的處理方法及裝置有效
| 申請號: | 201810581020.0 | 申請日: | 2018-06-05 |
| 公開(公告)號: | CN108776749B | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 許國良;張錦波;李季;蔣智;李瑞強 | 申請(專利權)人: | 北京諾禾致源科技股份有限公司 |
| 主分類號: | G16B25/00 | 分類號: | G16B25/00 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 趙囡囡;董文倩 |
| 地址: | 100083 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 序數 處理 方法 裝置 | ||
1.一種測序數據的處理方法,其特征在于,包括:
拆分三代測序數據,得到至少一個子測序數據;
將任意一個所述子測序數據比對到參考基因組,得到所述任意一個子測序數據對應的比對結果;
合并得到的所有比對結果,得到合并結果;
在合并得到的所有比對結果,得到合并結果之后,所述方法還包括:
從所述合并結果中提取比對到至少兩個contig的比對結果;
根據所述比對結果確定所述contig在Pacbio read上的方向,并計算具有連接關系的兩個contig之間的gap距離;
將任意一個所述子測序數據比對到參考基因組,得到所述任意一個子測序數據對應的比對結果,包括:
使用Mecat或minimap2對所述子測序數據進行比對;
將Mecat的結果和minimap2的結果改成M1文件格式;
將M1文件格式的所述Mecat的結果和所述minimap2的結果進行整合,得到所述比對 結果。
2.根據權利要求1所述的方法,其特征在于,將任意一個子測序數據比對到參考基因組,得到所述任意一個子測序數據對應的比對結果,包括:
使用高速比對軟件對拆分得到的任意一個子測序數據進行比對。
3.根據權利要求1所述的方法,其特征在于,在根據所述比對結果確定所述contig在Pacbio read上的方向,并計算所述具有連接關系的兩個contig之間的gap距離之后,所述方法還包括:
根據所述contig在Pacbio read上的方向以及所述具有連接關系的兩個contig之間的gap距離,從最大的contig開始連接scaffold,得到測序基因組。
4.根據權利要求1所述的方法,其特征在于,拆分得到每個所述子測序數據均為相同大小的fasta文件,其中,對所述相同大小的fasta文件進行并行的基因比對。
5.一種測序數據的處理裝置,其特征在于,包括:
拆分模塊,用于拆分三代測序數據,得到至少一個子測序數據;
處理模塊,用于將任意一個所述子測序數據比對到參考基因組,得到所述任意一個子測序數據比對結果;
合并模塊,用于合并得到的所有比對結果,得到合并結果;
提取模塊,用于從所述合并結果中提取比對到至少兩個contig的比對結果;
確定模塊,用于根據所述比對結果確定所述contig在Pacbio read上的方向;
計算模塊,用于計算具有連接關系的兩個contig之間的gap距離,所述處理模塊用于:
使用Mecat或minimap2對所述子測序數據進行比對;
將Mecat的結果和minimap2的結果改成M1文件格式;
將M1文件格式的所述Mecat的結果和所述minimap2的結果進行整合,得到所述比對 結果。
6.根據權利要求5所述的裝置,其特征在于,所述處理模塊,包括:
比對模塊,用于使用高速比對軟件對拆分得到的任意一個子測序數據進行比對。
7.根據權利要求5所述的裝置,其特征在于,所述裝置還包括:
連接模塊,根據所述contig在Pacbio read上的方向以及所述具有連接關系的兩個contig之間的gap距離,從最大的contig開始連接scaffold,得到測序基因組。
8.根據權利要求5所述的裝置,其特征在于,拆分得到每個所述子測序數據均為相同大小的fasta文件,其中,對所述相同大小的fasta文件進行并行的基因比對。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京諾禾致源科技股份有限公司,未經北京諾禾致源科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810581020.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基因檢測系統及其檢測方法
- 下一篇:一種耐藥結核分枝桿菌庫構建方法





