[發明專利]一種基因組變異檢測方法及檢測裝置有效
| 申請號: | 201611073982.2 | 申請日: | 2016-11-29 |
| 公開(公告)號: | CN108121897B | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 何俊;張旸;張洪波 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B30/10;G16B40/00 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因組 變異 檢測 方法 裝置 | ||
1.一種基因組變異檢測方法,由檢測裝置執行,其特征在于,包括:
將基因組的多條測序序列分別和參考序列進行雙序列比對,得到雙序列比對結果;
根據所述雙序列比對結果,確定所述基因組的潛在變異區域;
對每個潛在變異區域,在所有測序序列中抽取出處于所述潛在變異區域內的所有測序序列片段,根據所述所有測序序列片段創建迭代DeBruijn圖,根據所述迭代DeBruijn圖得到N個單倍體;其中,所述N為大于等于1的整數;
對于所述潛在變異區域內的任一測序序列片段,將所述測序序列片段與所述N個單倍體進行SW比對,將所述測序序列片段的最佳單倍體與參考序列片段進行SW比對,得到一組與該測序序列片段對應的SW比對結果;
根據預設變換規則,對每個測序序列片段的SW比對結果進行轉換,得到每個測序序列片段與所述參考序列片段的校正對齊結果;所述預設變換規則用于將所述每個測序序列片段與所述參考序列片段對齊;
根據每個測序序列片段與所述參考序列片段的校正對齊結果,確定所述基因組的變異類型。
2.根據權利要求1所述的方法,其特征在于,所述根據所述雙序列比對結果,確定所述基因組的潛在變異區域,包括:
根據所述基因組的編碼順序,將所述基因組劃分為多個編碼區間;
根據所述雙序列比對結果,確定所有測序序列的變異類型;
統計每個編碼區間內不同變異類型的測序序列的概率分布值;
根據所述編碼區間內不同變異類型的測序序列的概率分布值,計算所述編碼區間的信息熵;
判斷每個編碼區間的信息熵是否大于第一閾值,若存在第一編碼區間,所述第一編碼區間的信息熵大于第一閾值,則確定所述第一編碼區間為潛在變異區域。
3.根據權利要求1所述的方法,其特征在于,所述根據所述雙序列比對結果,確定所述基因組的潛在變異區域,包括:
根據所述基因組的編碼順序,將所述基因組劃分為多個編碼區間;
統計每個編碼區間內發生變異的測序序列的數量;
判斷每個編碼區間內發生變異的測序序列的數量是否大于第二閾值;
若存在第一編碼區間,所述第一編碼區間內發生變異的測序序列的數量大于第二閾值,則確定所述第一編碼區間為潛在變異區域。
4.根據權利要求1-3任一項所述的方法,其特征在于,所述根據所述所有測序序列片段創建迭代DeBruijn圖,包括:
a)初始化kmer的值k;
b)從所述所有測序序列當中過濾掉支持數低于設定閾值的kmer,并以所述kmer作為節點,過濾后的測序序列上的相鄰kmer作為邊,創建最初始的DeBruijn圖;
c)遍歷當前DeBruijn圖產生多個contig,過濾出長度大于測序儀讀長的contig作為新擴充的測序序列,并刪除掉所述所有測序序列中被所述新擴充的測序序列完全包含的測序序列,同時,將k值加1;
d)以所述所有測序序列中剩下的測序序列和所述新擴充的測序序列按照新的k值,以所述kmer作為節點,所述所有測序序列上的相鄰kmer作為邊創建新的DeBruijn圖;其中,所述k值為kmer長度,所述當前DeBruijn圖根據所述k值創建;
重復上述c)~d)過程,直至所述k值為預設的最大kmax值,將最大kmax值對應的當前DeBruijn圖作為最終需要的迭代DeBruijn圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611073982.2/1.html,轉載請聲明來源鉆瓜專利網。





