[發(fā)明專利]循環(huán)腫瘤DNA重復(fù)序列的處理方法及裝置有效
| 申請?zhí)枺?/td> | 201810035616.0 | 申請日: | 2018-01-15 |
| 公開(公告)號: | CN108595918B | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計)人: | 郭昊;于佳寧;韓天澄;宋雪;林小靜 | 申請(專利權(quán))人: | 無錫臻和生物科技有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 趙囡囡 |
| 地址: | 214500 江蘇省無錫市錫山區(qū)*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 循環(huán) 腫瘤 dna 重復(fù) 序列 處理 方法 裝置 | ||
本發(fā)明公開了一種循環(huán)腫瘤DNA重復(fù)序列的處理方法及裝置。其中,該方法包括:獲取待檢測循環(huán)腫瘤DNA的測序數(shù)據(jù)和參考基因組序列,其中,測序數(shù)據(jù)為對待檢測循環(huán)腫瘤DNA進(jìn)行高通量測序得到的數(shù)據(jù),測序數(shù)據(jù)包括:多對雙端序列;將測序數(shù)據(jù)和參考基因組序列進(jìn)行比對,得到第一比對結(jié)果,其中,第一比對結(jié)果至少包括:多對雙端序列的基因組位置、堿基序列和對應(yīng)的堿基質(zhì)量值序列;基于第一比對結(jié)果,得到至少一個一致性序列和每個一致性序列對應(yīng)的堿基質(zhì)量值序列。本發(fā)明解決了現(xiàn)有技術(shù)中測序數(shù)據(jù)的處理方法對樣本測序進(jìn)行重復(fù)序列刪除或標(biāo)記,準(zhǔn)確度低的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及遺傳工程領(lǐng)域,具體而言,涉及一種循環(huán)腫瘤DNA重復(fù)序列的處理方法及裝置。
背景技術(shù)
腫瘤細(xì)胞在進(jìn)行分裂增殖過程當(dāng)中,會凋亡、死亡、壞死,也會主動向體液中釋放攜帶有腫瘤突變的DNA碎片,也即循環(huán)腫瘤DNA(circulating tumor DNA,簡稱為ctDNA),多存在于血液、滑膜液和腦脊液等體液中,尤其是血漿游離DNA(cell-free DNA,cfDNA)中。通過對ctDNA的測序,檢測腫瘤細(xì)胞DNA分子上發(fā)生堿基序列改變(突變)的基因組區(qū)域,能夠有效反應(yīng)病人對治療的響應(yīng);在檢測到藥物響應(yīng)之后,腫瘤有可能對藥物治療產(chǎn)生耐藥,ctDNA檢測也可以追蹤耐藥突變的產(chǎn)生,定性定量;檢測手術(shù)后是否存在殘余組織,判斷預(yù)后效果以及早期腫瘤的篩查。不同于常規(guī)的基因組DNA,ctDNA片段較短,通常只有100~400bp,而且在血液中含量較少,所以實際中能提取到的ctDNA量含量很低。
由于ctDNA片段較短且含量較低的特點,因此在提取量較少時,需要在建庫階段進(jìn)行多輪聚合酶鏈?zhǔn)椒磻?yīng)(Polymerase Chain Reaction,簡稱為PCR),擴(kuò)大原始提取DNA的含量,以產(chǎn)生足夠的DNA分子數(shù)目做高通量測序(High-throughput sequencing,簡稱為NGS測序)和后續(xù)生物信息學(xué)分析。由于PCR擴(kuò)增導(dǎo)致對一個分子進(jìn)行多次鏡像復(fù)制,產(chǎn)生重復(fù)序列(Duplicated reads),這些無效的重復(fù)數(shù)據(jù)對于檢測變異極容易引入人工誤差。對于最理想的NGS數(shù)據(jù)分析流程中,都需要盡可能把所有通過PCR獲得的測序數(shù)據(jù)全部去除,還原到?jīng)]有PCR的狀態(tài)。
現(xiàn)有技術(shù)中,提供了兩種重復(fù)序列的去重方法,samtools rmdup和Picard’sMarkDuplicates。其中,samtools rmdup的工作原理為:NGS測序得到的序列(read)通過與人類參考基因組比對(mapping),得到這條read的比對位置,如果不同的reads比對到相同的基因組位置,則認(rèn)為這部分的reads是通過PCR產(chǎn)生的多個重復(fù)序列,只保留mapping質(zhì)量最高的read,刪除其余的重復(fù)序列。對于PE reads,如果兩端的read比多到基因組的不同染色體上或者兩者之前的距離過長(即不是Proper Paired),則不作去重考慮。Picard’sMarkDuplicates的基本思路與samtools rmdup相同,通過比較reads中5'端的mapping位置,對于具有相同5'位置的序列,選取測序質(zhì)量最高的reads作為去重后保留的唯一reads,且對于PE reads不是Proper Paired的情況也會做去重處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于無錫臻和生物科技有限公司,未經(jīng)無錫臻和生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810035616.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





