[發(fā)明專利]基于靶向捕獲測序的甲基化標志物篩選與評價方法及裝置有效
| 申請?zhí)枺?/td> | 202110078570.2 | 申請日: | 2021-01-21 |
| 公開(公告)號: | CN112397151B | 公開(公告)日: | 2021-04-20 |
| 發(fā)明(設(shè)計)人: | 韓天澄;宋小鳳;于佳寧;洪媛媛;裴志華;何驥;陳維之;杜波 | 申請(專利權(quán))人: | 臻和(北京)生物科技有限公司;無錫臻和生物科技股份有限公司 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B30/10;G16B20/30;G16B20/20;G06F17/16 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231 | 代理人: | 顧翰林 |
| 地址: | 100191 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 靶向 捕獲 甲基化 標志 篩選 評價 方法 裝置 | ||
本發(fā)明提供了一種基于靶向捕獲測序的甲基化標志物篩選與評價方法及裝置,方法包括:分別獲取N個待測樣本捕獲測序的FASTQ文件,并生成Bam文件;計算每個甲基化位點的甲基化水平和覆蓋深度,合并得到甲基化水平矩陣和位點深度矩陣;針對每個甲基化位點,計算其與下一甲基化位點之間的距離及線性相關(guān)系數(shù),并根據(jù)結(jié)果合并得到甲基化連鎖區(qū)域;計算連鎖區(qū)域甲基化水平均值矩陣和位點深度均值矩陣,篩選出與正常人群組存在設(shè)定差異的特異連鎖區(qū)域;根據(jù)得到的特異連鎖區(qū)域分別計算各待測樣本的甲基化得分,并根據(jù)甲基化得分對甲基化標志物進行評價。經(jīng)過本發(fā)明篩選與評價的標志物能有效發(fā)現(xiàn)血漿中的ctDNA甲基化信號,獲得更高的靈敏度。
技術(shù)領(lǐng)域
本發(fā)明涉及生物醫(yī)學技術(shù)領(lǐng)域,尤其涉及一種甲基化標志物篩選與評價方法及裝置。
背景技術(shù)
循環(huán)腫瘤DNA(circμLating tumor ,ctDNA)由腫瘤細胞因分泌、凋亡或壞死而產(chǎn)生,是循環(huán)游離DNA(circμLating cell-free DNA,cfDNA)中的一種。ctDNA在血液中的半衰期短,且攜帶有部分腫瘤細胞特有的特征,可用于腫瘤患者的早期篩查或?qū)崟r監(jiān)控。除單核苷酸多態(tài)性(Single Nucleotide Polymorphisms,SNP)、插入缺失標記(insertion-deletion,InDel)與拷貝數(shù)變異(copy number variation,CNV)外,甲基化作為基因表達調(diào)控中的重要環(huán)節(jié),同樣能夠影響基因組的穩(wěn)定性。對于一些特定位點或區(qū)域的甲基化狀況,腫瘤患者的ctDNA和健康人的cfDNA之間會存在明顯差異,以此,通過從血漿中檢測這些特定位點或區(qū)域的甲基化狀況,能夠在腫瘤發(fā)生的早期識別出血漿中ctDNA的存在,為后續(xù)癌癥的早期診斷或復(fù)發(fā)預(yù)測提供數(shù)據(jù)基礎(chǔ)。
近年來甲基化測序的應(yīng)用一定程度上提高了ctDNA的檢測靈敏度,但是這些技術(shù)大多將檢測樣本限定在糞便、痰液等與腫瘤的發(fā)生器官高度相關(guān)的樣本中,且只能檢測某一特定類型的ctDNA進行檢測。目前,廣泛使用的甲基化測序技術(shù)大多為聚合酶鏈式反應(yīng)(PCR)、全基因組甲基化測序(WGBS)或靶向捕獲測序。其中,PCR雖然成本較低,但能檢測的甲基化位點數(shù)量較為有限,進而影響檢測的靈敏度和特異性。WGBS雖然覆蓋位點更全,但成本高、深度低,不利于從血漿樣本中發(fā)現(xiàn)ctDNA的甲基化信號。由于各測序方式都需要在測序前對DNA進行重亞硫酸鹽轉(zhuǎn)化,甲基化位點的甲基化水平計算的準確性會受到轉(zhuǎn)化效率的影響,不利于甲基化標志物的篩選,同時也影響對樣本進行標志物檢驗時的準確性。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明提供了一種基于靶向捕獲測序的甲基化標志物篩選與評價方法及裝置,有效解決現(xiàn)有甲基化測序中依從性差、適用范圍窄、靈敏度不高的技術(shù)問題。
本發(fā)明提供的技術(shù)方案如下:
一方面,本發(fā)明提供了一種基于靶向捕獲測序的甲基化標志物篩選與評價方法,包括:
分別獲取N個待測樣本捕獲測序的FASTQ文件,并分別與參考基因組進行比對生成Bam文件,所述待測樣本為血漿樣本;
依次計算各待測樣本Bam文件目標區(qū)域內(nèi)個甲基化位點上的甲基化水平和覆蓋深度,并合并得到甲基化水平矩陣和位點深度矩陣;
基于所述甲基化水平矩陣和位點深度矩陣,針對待測樣本中的每一個甲基化位點,分別計算其與下一甲基化位點之間的距離及甲基化水平的線性相關(guān)系數(shù),并根據(jù)計算結(jié)果依次對相鄰甲基化位點進行合并得到甲基化連鎖區(qū)域,將包含有預(yù)設(shè)數(shù)量甲基化位點的個甲基化連鎖區(qū)域作為甲基化標志物候選區(qū)域輸出;
依次計算各待測樣本中個甲基化連鎖區(qū)域內(nèi)的甲基化水平均值和位點深度均值,生成連鎖區(qū)域甲基化水平均值矩陣和位點深度均值矩陣;
根據(jù)所述連鎖區(qū)域甲基化水平均值矩陣和位點深度均值矩陣于合并得到的甲基化連鎖區(qū)域中進一步篩選出與正常人群組存在設(shè)定差異的特異連鎖區(qū)域,得到甲基化標志物;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于臻和(北京)生物科技有限公司;無錫臻和生物科技股份有限公司,未經(jīng)臻和(北京)生物科技有限公司;無錫臻和生物科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110078570.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





