[發(fā)明專利]基于靶向捕獲測(cè)序的甲基化標(biāo)志物篩選與評(píng)價(jià)方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110078570.2 | 申請(qǐng)日: | 2021-01-21 |
| 公開(公告)號(hào): | CN112397151B | 公開(公告)日: | 2021-04-20 |
| 發(fā)明(設(shè)計(jì))人: | 韓天澄;宋小鳳;于佳寧;洪媛媛;裴志華;何驥;陳維之;杜波 | 申請(qǐng)(專利權(quán))人: | 臻和(北京)生物科技有限公司;無錫臻和生物科技股份有限公司 |
| 主分類號(hào): | G16B40/00 | 分類號(hào): | G16B40/00;G16B30/10;G16B20/30;G16B20/20;G06F17/16 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231 | 代理人: | 顧翰林 |
| 地址: | 100191 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 靶向 捕獲 甲基化 標(biāo)志 篩選 評(píng)價(jià) 方法 裝置 | ||
1.一種基于靶向捕獲測(cè)序的甲基化標(biāo)志物篩選與評(píng)價(jià)方法,其特征在于,包括:
分別獲取N個(gè)待測(cè)樣本捕獲測(cè)序的FASTQ文件,并分別與參考基因組進(jìn)行比對(duì)生成Bam文件,所述待測(cè)樣本為血漿樣本;
依次計(jì)算各待測(cè)樣本Bam文件目標(biāo)區(qū)域內(nèi)個(gè)甲基化位點(diǎn)上的甲基化水平和覆蓋深度,并合并得到甲基化水平矩陣和位點(diǎn)深度矩陣;
基于所述甲基化水平矩陣和位點(diǎn)深度矩陣,針對(duì)待測(cè)樣本中的每一個(gè)甲基化位點(diǎn),分別計(jì)算其與下一甲基化位點(diǎn)之間的距離及甲基化水平的線性相關(guān)系數(shù),并根據(jù)計(jì)算結(jié)果依次對(duì)相鄰甲基化位點(diǎn)進(jìn)行合并得到甲基化連鎖區(qū)域,將包含有預(yù)設(shè)數(shù)量甲基化位點(diǎn)的個(gè)甲基化連鎖區(qū)域作為甲基化標(biāo)志物候選區(qū)域輸出;
依次計(jì)算各待測(cè)樣本中個(gè)甲基化連鎖區(qū)域內(nèi)的甲基化水平均值和位點(diǎn)深度均值,生成連鎖區(qū)域甲基化水平均值矩陣和位點(diǎn)深度均值矩陣;
根據(jù)所述連鎖區(qū)域甲基化水平均值矩陣和位點(diǎn)深度均值矩陣于合并得到的甲基化連鎖區(qū)域中進(jìn)一步篩選出與正常人群組存在設(shè)定差異的特異連鎖區(qū)域,得到甲基化標(biāo)志物;
根據(jù)篩選得到的特異連鎖區(qū)域分別計(jì)算各待測(cè)樣本的甲基化得分,并根據(jù)所述甲基化得分對(duì)甲基化標(biāo)志物進(jìn)行評(píng)價(jià)。
2.如權(quán)利要求1所述的甲基化標(biāo)志物篩選與評(píng)價(jià)方法,其特征在于,在所述分別獲取N個(gè)待測(cè)樣本捕獲測(cè)序的FASTQ文件,并分別與參考基因組進(jìn)行比對(duì)生成Bam文件之后,還包括:
根據(jù)預(yù)先設(shè)定的C-T轉(zhuǎn)化率對(duì)生成的Bam文件中的reads進(jìn)行逐條過濾,得到過濾后的Bam文件;和/或,
根據(jù)目標(biāo)區(qū)域Bed文件及預(yù)先設(shè)定的各reads中覆蓋甲基化位點(diǎn)的數(shù)量對(duì)Bam文件進(jìn)行過濾,得到過濾后的Bam文件。
3.如權(quán)利要求1或2所述的甲基化標(biāo)志物篩選與評(píng)價(jià)方法,其特征在于,在所述依次計(jì)算各待測(cè)樣本Bam文件目標(biāo)區(qū)域內(nèi)個(gè)甲基化位點(diǎn)上的甲基化水平和覆蓋深度,并合并到甲基化水平矩陣和位點(diǎn)深度矩陣中,包括:
依次提取各待測(cè)樣本Bam文件中各個(gè)甲基化位點(diǎn)的正鏈信息和負(fù)鏈信息;
依次計(jì)算各待測(cè)樣本中各個(gè)甲基化位點(diǎn)的甲基化水平和覆蓋深度,其中,樣本
其中,表示樣本
將計(jì)算得到的各甲基化位點(diǎn)的甲基化水平和覆蓋深度進(jìn)行合并得到甲基化水平矩陣和位點(diǎn)深度矩陣,所述甲基化水平矩陣和位點(diǎn)深度矩陣均為
4.如權(quán)利要求1或2所述的甲基化標(biāo)志物篩選與評(píng)價(jià)方法,其特征在于,在所述基于甲基化水平矩陣和位點(diǎn)深度矩陣,針對(duì)待測(cè)樣本中的每一個(gè)甲基化位點(diǎn),分別計(jì)算其與下一甲基化位點(diǎn)之間的距離及甲基化水平的線性相關(guān)系數(shù),并根據(jù)計(jì)算結(jié)果依次對(duì)相鄰甲基化位點(diǎn)進(jìn)行合并得到甲基化連鎖區(qū)域,將包含有預(yù)設(shè)數(shù)量甲基化位點(diǎn)的個(gè)甲基化連鎖區(qū)域作為甲基化標(biāo)志物候選區(qū)域輸出中,針對(duì)樣本
判斷甲基化位點(diǎn)及其下一甲基化位點(diǎn)的覆蓋深度是否均在預(yù)設(shè)最低深度要求之上;
若是,計(jì)算甲基化位點(diǎn)和甲基化位點(diǎn)之間的距離;
計(jì)算甲基化位點(diǎn)上各待測(cè)樣本的甲基化水平與甲基化位點(diǎn)上各待測(cè)樣本的甲基化水平之間的線性相關(guān)系數(shù);其中,表示樣本1在甲基化位點(diǎn)上的甲基化水平,表示樣本N在甲基化位點(diǎn)上的甲基化水平,表示樣本1在甲基化位點(diǎn)上的甲基化水平,表示樣本N在甲基化位點(diǎn)上的甲基化水平;
判斷是否同時(shí)滿足條件和,其中,為預(yù)設(shè)最大位點(diǎn)間間距,為預(yù)設(shè)最小相關(guān)系數(shù);
若是,將甲基化位點(diǎn)并入甲基化位點(diǎn)當(dāng)前所在的甲基化連鎖區(qū)域形成新的甲基化連鎖區(qū)域,否則斷開甲基化位點(diǎn)當(dāng)前所在的甲基化連鎖區(qū)域,。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于臻和(北京)生物科技有限公司;無錫臻和生物科技股份有限公司,未經(jīng)臻和(北京)生物科技有限公司;無錫臻和生物科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110078570.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





