[發明專利]循環腫瘤DNA重復序列的處理方法及裝置有效
| 申請號: | 201810035620.7 | 申請日: | 2018-01-15 |
| 公開(公告)號: | CN108229103B | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 郭昊;于佳寧;韓天澄;宋雪;林小靜 | 申請(專利權)人: | 無錫臻和生物科技有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B20/20 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 趙囡囡 |
| 地址: | 214500 江蘇省無錫市錫山區*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 循環 腫瘤 dna 重復 序列 處理 方法 裝置 | ||
1.一種循環腫瘤DNA重復序列的處理方法,其特征在于,包括:
獲取待檢測循環腫瘤DNA的測序數據和參考基因組序列,其中,所述測序數據為對待檢測循環腫瘤DNA進行高通量測序得到的數據,所述測序數據包括:多對雙端序列;
將所述測序數據和所述參考基因組序列進行比對,得到第一比對結果,其中,所述第一比對結果至少包括:所述多對雙端序列的基因組位置、堿基序列和對應的堿基質量值序列;
基于所述第一比對結果,確定每對雙端序列的類型,其中,所述類型包括:獨立序列和重復序列;
其中,基于所述第一比對結果,確定每對雙端序列的類型包括:
將所述多對雙端序列劃分為至少一個序列集合,其中,每個序列集合包括:至少一對雙端序列,同一個序列集合中的雙端序列的基因組位置相同且堿基序列相同;
計算每個序列集合中每對雙端序列包含的所有堿基的堿基質量值之和,得到所述每個序列集合中所述每對雙端序列的堿基質量和;
獲取所述每個序列集合中最大堿基質量和對應的第一雙端序列;
將所述每個序列集合中所述第一雙端序列作為所述獨立序列,并將所述每個序列集合中除所述第一雙端序列之外的其他第二雙端序列作為所述重復序列;
將所述多對雙端序列劃分為至少一個序列集合包括:
將每對雙端序列的與所述多對雙端序列中除所述每對雙端序列之外的任意一對雙端序列進行比較;
如果所述每對雙端序列的基因組位置和所述任意一對雙端序列的基因組位置相同,且所述每對雙端序列中每個堿基位置上的堿基類型與所述任意一對雙端序列中每個堿基位置上的堿基類型相同,則將所述每對雙端序列和所述任意一對雙端序列劃分為同一個序列集合。
2.根據權利要求1所述的方法,其特征在于,在基于所述第一比對結果,確定每對雙端序列的類型之后,所述方法還包括:
在所述第一比對結果中,對所述重復序列進行標記。
3.根據權利要求2所述的方法,其特征在于,所述第一比對結果還包括:標記位,其中,在所述第一比對結果中,對所述重復序列進行標記包括:
獲取所述重復序列的標記位的當前值;
計算所述當前值與預設值之和,得到和值;
將所述當前值修改為所述和值。
4.根據權利要求2所述的方法,其特征在于,在所述第一比對結果中,對所述重復序列進行標記之后,所述方法還包括:
根據所述第一比對結果,顯示每個基因組位置對應的雙端序列的比對信息和堿基質量值;
對比對質量滿足預設條件的雙端序列進行過濾。
5.根據權利要求2所述的方法,其特征在于,在所述第一比對結果中,對所述重復序列進行標記之后,所述方法還包括:
獲取捕獲測序區間;
根據所述捕獲測序區間,對所述獨立序列進行單核苷酸變異檢測和插入缺失檢測,得到檢測結果。
6.根據權利要求1所述的方法,其特征在于,在基于所述第一比對結果,確定每對雙端序列的類型之前,所述方法還包括:
按照所述每對雙端序列的基因組位置,對所述第一比對結果進行排序,得到第二比對結果,并為所述第二比對結果建立索引;
對所述第二比對結果進行過濾,得到第三比對結果;
基于所述第三比對結果,確定所述每對雙端序列的類型。
7.根據權利要求1所述的方法,其特征在于,將所述測序數據和所述參考基因組序列進行比對,得到第一比對結果包括:
獲取所述多對雙端序列中每條序列和所述參考基因組序列中的每段序列的匹配度;
獲取最高匹配度對應的至少一段序列,得到所述每條序列的匹配序列;
根據所述每條序列的匹配序列,確定所述每條序列的基因組位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫臻和生物科技有限公司,未經無錫臻和生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810035620.7/1.html,轉載請聲明來源鉆瓜專利網。





