[發(fā)明專利]一種基于三代測序的全基因組結構變異分析方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201710266327.7 | 申請日: | 2017-04-21 |
| 公開(公告)號: | CN107180166B | 公開(公告)日: | 2020-09-01 |
| 發(fā)明(設計)人: | 汪德鵬;方立;王凱;張朋;胡江 | 申請(專利權)人: | 北京希望組生物科技有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20 |
| 代理公司: | 武漢河山金堂專利事務所(普通合伙) 42212 | 代理人: | 胡清堂 |
| 地址: | 102206 北京市昌平區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 三代測序 基因組 結構 變異 分析 方法 系統(tǒng) | ||
1.一種基于三代測序的全基因組結構變異分析方法,其特征在于,包括以下流程:
1)序列拆分,將基因組的測序序列拆分成若干個用于同步分析的子序列;
2)序列比對,將每個所述子序列分別通過兩種比對工具與參考基因組比對,獲得的比對結果分別通過合并工具合并得到兩組比對序列;
3)基因組結構變異初步檢測,將所述兩組比對序列中每組比對序列僅通過對應的一種結構變異分析工具進行檢測,兩組比對序列經(jīng)分別檢測后得到兩組基因組結構變異初步檢測結果;
4)基因組結構變異初步檢測結果合并篩選:
4.1)分別將兩組基因組結構變異初步檢測結果轉換成統(tǒng)一格式;
4.2)合并兩組基因組結構變異初步檢測結果:
4.2.1)遍歷兩組基因組結構變異初步檢測結果中的缺失序列,如果所述兩組基因組結構變異初步檢測結果中缺失序列重疊部分的長度分別占兩缺失序列長度的比例均大于50%,則判定該兩個缺失序列為同一個缺失序列;反之,兩個缺失序列為不同的缺失序列;
4.2.2)分別計算4.2.1)中所述判定為同一個缺失序列的兩個缺失序列的起始位點和終止位點的均值,所述均值為4.2.1)所述判定的同一個缺失序列的起始位點和終止位點;
4.2.3)重復4.2.1)和4.2.2)中步驟,篩選出兩組基因組結構變異初步檢測結果中所有同一個缺失序列,放入缺失序列的交集;篩選出兩組基因組結構變異初步檢測結果中所有不同的缺失序列,放入缺失序列的并集;
4.2.4)遍歷兩組基因組結構變異初步檢測結果中的插入序列,判斷如果兩插入序列的距離小于1000bp,則判定該兩個插入序列為同一個插入序列;反之,兩個插入序列為不同的插入序列;
4.2.5)分別計算4.2.4)中所述判定為同一個插入序列的兩個插入序列的起始位點和終止位點的均值,所述均值為4.2.4)所述判定的同一個插入序列的起始位點和終止位點;
4.2.6)重復4.2.4)和4.2.5)中步驟,篩選出兩組基因組結構變異初步檢測結果中所有同一個插入序列,放入插入序列的交集;篩選出兩組基因組結構變異初步檢測結果中所有不同的插入序列,放入插入序列的并集;
4.3)數(shù)據(jù)結果質控:
根據(jù)交集和并集中的基因組結構變異檢測結果的比例以及該區(qū)域的覆蓋度,所述該區(qū)域為交集和并集中的基因組結構變異,所述交集包括缺失序列的交集和插入序列的交集,所述并集包括缺失序列的并集和插入序列的并集,支持數(shù)低于20%的基因組結構變異刪除,得到基因組結構變異最終檢測結果;
5)基因組結構變異功能注釋,利用注釋工具注釋基因組結構變異最終檢測結果。
2.根據(jù)權利要求1所述一種基于三代測序的全基因組結構變異分析方法,其特征在于,所述步驟2)中所述兩種比對工具分別為blasr和bwa;所述步驟2)中合并工具為samtools。
3.根據(jù)權利要求2所述一種基于三代測序的全基因組結構變異分析方法,其特征在于,所述步驟3)中通過blasr比對得到的比對序列對應的結構變異分析工具為PBhoney;所述步驟3)中通過bwa比對得到的比對序列對應的結構變異分析工具為Sniffles。
4.根據(jù)權利要求3所述一種基于三代測序的全基因組結構變異分析方法,其特征在于,所述步驟4.1)中的統(tǒng)一格式為bed格式。
5.根據(jù)權利要求4所述一種基于三代測序的全基因組結構變異分析方法,其特征在于,所述步驟5)中的注釋工具為annovar。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京希望組生物科技有限公司,未經(jīng)北京希望組生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710266327.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 一種核酸第三代測序原始數(shù)據(jù)的處理方法及其應用
- 三代測序數(shù)據(jù)糾錯的方法、裝置和計算機可讀存儲介質
- 確定胎兒脊髓性肌肉萎縮癥基因單體型的方法及系統(tǒng)
- 確定胎兒Duchenne型肌營養(yǎng)不良基因單體型的方法及系統(tǒng)
- 確定胎兒beta地中海貧血基因單體型的方法及系統(tǒng)
- 確定胎兒alpha地中海貧血基因單體型的系統(tǒng)
- 一種基于DNA變異檢測的三代數(shù)據(jù)校正方法
- 綜合應用第三代超長測序讀段和第二代鏈接式讀段從頭組裝基因組的方法
- 第三代測序用標簽序列、接頭序列、試劑盒和第三代測序建庫方法
- 無參考基因組序列的轉錄組分析方法及系統(tǒng)





