[發明專利]循環腫瘤DNA重復序列的處理方法及裝置有效
| 申請號: | 201810035616.0 | 申請日: | 2018-01-15 |
| 公開(公告)號: | CN108595918B | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 郭昊;于佳寧;韓天澄;宋雪;林小靜 | 申請(專利權)人: | 無錫臻和生物科技有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 趙囡囡 |
| 地址: | 214500 江蘇省無錫市錫山區*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 循環 腫瘤 dna 重復 序列 處理 方法 裝置 | ||
1.一種循環腫瘤DNA重復序列的處理方法,其特征在于,包括:
獲取待檢測循環腫瘤DNA的測序數據和參考基因組序列,其中,所述測序數據為對待檢測循環腫瘤DNA進行高通量測序得到的數據,所述測序數據包括:多對雙端序列;
將所述測序數據和所述參考基因組序列進行比對,得到第一比對結果,其中,所述第一比對結果至少包括:所述多對雙端序列的基因組位置、堿基序列和對應的堿基質量值序列;
基于所述第一比對結果,得到至少一個一致性序列和每個一致性序列對應的堿基質量值序列;
其中,基于所述第一比對結果,得到至少一個一致性序列和每個一致性序列對應的堿基質量值序列包括:
將所述多對雙端序列劃分為至少一個序列集合,其中,每個序列集合包括:至少一對雙端序列,同一個序列集合中的雙端序列的基因組位置相同;
將每個序列集合中的每對雙端序列逐堿基進行比較,得到所述每個序列集合中每個堿基位置上每個堿基類型的數量;
獲取所述每個序列集合中每個堿基位置上數量超過預設數量的第一堿基類型;將所述每個序列集合中所述每個堿基位置上的第一堿基類型進行組合,得到所述每個序列集合對應的一致性序列;
根據每個一致性序列的每個堿基位置上第一堿基類型的堿基質量值及除所述第一堿基類型之外的其他堿基類型的堿基質量值,得到所述每個一致性序列對應的堿基質量值序列。
2.根據權利要求1所述的方法,其特征在于,在基于所述第一比對結果,得到至少一個一致性序列和每個一致性序列對應的堿基質量值序列之后,所述方法還包括:
將所述至少一個一致性序列和所述參考基因組序列進行比對,得到第二比對結果;
按照每個一致性序列的基因組位置,對所述第二比對結果進行排序,得到第三比對結果。
3.根據權利要求2所述的方法,其特征在于,在按照每個一致性序列的基因組位置,對所述第二比對結果進行排序,得到第三比對結果之后,所述方法還包括:
根據所述第三比對結果,顯示每個基因組位置對應的雙端序列的比對信息和堿基質量值;
對比對質量滿足預設條件的雙端序列進行過濾。
4.根據權利要求2所述的方法,其特征在于,在按照每個一致性序列的基因組位置,對所述第二比對結果進行排序,得到第三比對結果之后,所述方法還包括:
獲取捕獲測序區間;
根據所述捕獲測序區間,對所述每個一致性序列進行單核苷酸變異檢測和插入缺失檢測,得到檢測結果。
5.根據權利要求1所述的方法,其特征在于,在基于所述第一比對結果,得到至少一個一致性序列和每個一致性序列對應的堿基質量值序列之前,所述方法還包括:
按照所述多對雙端序列的基因組位置,對所述第一比對結果進行排序,得到第四比對結果,并為所述第四比對結果建立索引;
對所述第四比對結果進行過濾,得到第五比對結果;
基于所述第五比對結果,得到所述至少一個一致性序列和所述每個一致性序列對應的堿基質量值序列。
6.根據權利要求1所述的方法,其特征在于,將所述測序數據和所述參考基因組序列進行比對,得到第一比對結果包括:
獲取所述多對雙端序列中每條序列和所述參考基因組序列中的每段序列的匹配度;
獲取最高匹配度對應的至少一段序列,得到所述每條序列的匹配序列;
根據所述每條序列的匹配序列,確定所述每條序列的基因組位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫臻和生物科技有限公司,未經無錫臻和生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810035616.0/1.html,轉載請聲明來源鉆瓜專利網。





