[發(fā)明專利]基于靶向捕獲測(cè)序的甲基化標(biāo)志物篩選與評(píng)價(jià)方法及裝置有效

申請(qǐng)?zhí)枺?/td>	202110078570.2	申請(qǐng)日：	2021-01-21
公開（公告）號(hào)：	CN112397151B	公開（公告）日：	2021-04-20
發(fā)明（設(shè)計(jì)）人：	韓天澄;宋小鳳;于佳寧;洪媛媛;裴志華;何驥;陳維之;杜波	申請(qǐng)（專利權(quán)）人：	臻和（北京）生物科技有限公司;無錫臻和生物科技股份有限公司
主分類號(hào)：	G16B40/00	分類號(hào)：	G16B40/00;G16B30/10;G16B20/30;G16B20/20;G06F17/16
代理公司：	常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231	代理人：	顧翰林
地址：	100191 北京市海淀***	國(guó)省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于靶向捕獲甲基化標(biāo)志篩選評(píng)價(jià) 方法裝置
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于靶向捕獲測(cè)序的甲基化標(biāo)志物篩選與評(píng)價(jià)方法，其特征在于，包括：

分別獲取N個(gè)待測(cè)樣本捕獲測(cè)序的FASTQ文件，并分別與參考基因組進(jìn)行比對(duì)生成Bam文件，所述待測(cè)樣本為血漿樣本；

依次計(jì)算各待測(cè)樣本Bam文件目標(biāo)區(qū)域內(nèi)個(gè)甲基化位點(diǎn)上的甲基化水平和覆蓋深度，并合并得到甲基化水平矩陣和位點(diǎn)深度矩陣；

基于所述甲基化水平矩陣和位點(diǎn)深度矩陣，針對(duì)待測(cè)樣本中的每一個(gè)甲基化位點(diǎn)，分別計(jì)算其與下一甲基化位點(diǎn)之間的距離及甲基化水平的線性相關(guān)系數(shù)，并根據(jù)計(jì)算結(jié)果依次對(duì)相鄰甲基化位點(diǎn)進(jìn)行合并得到甲基化連鎖區(qū)域，將包含有預(yù)設(shè)數(shù)量甲基化位點(diǎn)的個(gè)甲基化連鎖區(qū)域作為甲基化標(biāo)志物候選區(qū)域輸出；

依次計(jì)算各待測(cè)樣本中個(gè)甲基化連鎖區(qū)域內(nèi)的甲基化水平均值和位點(diǎn)深度均值，生成連鎖區(qū)域甲基化水平均值矩陣和位點(diǎn)深度均值矩陣；

根據(jù)所述連鎖區(qū)域甲基化水平均值矩陣和位點(diǎn)深度均值矩陣于合并得到的甲基化連鎖區(qū)域中進(jìn)一步篩選出與正常人群組存在設(shè)定差異的特異連鎖區(qū)域，得到甲基化標(biāo)志物；

根據(jù)篩選得到的特異連鎖區(qū)域分別計(jì)算各待測(cè)樣本的甲基化得分，并根據(jù)所述甲基化得分對(duì)甲基化標(biāo)志物進(jìn)行評(píng)價(jià)。

2.如權(quán)利要求1所述的甲基化標(biāo)志物篩選與評(píng)價(jià)方法，其特征在于，在所述分別獲取N個(gè)待測(cè)樣本捕獲測(cè)序的FASTQ文件，并分別與參考基因組進(jìn)行比對(duì)生成Bam文件之后，還包括：

根據(jù)預(yù)先設(shè)定的C-T轉(zhuǎn)化率對(duì)生成的Bam文件中的reads進(jìn)行逐條過濾，得到過濾后的Bam文件；和/或，

根據(jù)目標(biāo)區(qū)域Bed文件及預(yù)先設(shè)定的各reads中覆蓋甲基化位點(diǎn)的數(shù)量對(duì)Bam文件進(jìn)行過濾，得到過濾后的Bam文件。

3.如權(quán)利要求1或2所述的甲基化標(biāo)志物篩選與評(píng)價(jià)方法，其特征在于，在所述依次計(jì)算各待測(cè)樣本Bam文件目標(biāo)區(qū)域內(nèi)個(gè)甲基化位點(diǎn)上的甲基化水平和覆蓋深度，并合并到甲基化水平矩陣和位點(diǎn)深度矩陣中，包括：

依次提取各待測(cè)樣本Bam文件中各個(gè)甲基化位點(diǎn)的正鏈信息和負(fù)鏈信息；

依次計(jì)算各待測(cè)樣本中各個(gè)甲基化位點(diǎn)的甲基化水平和覆蓋深度，其中，樣本n在甲基化位點(diǎn)上的甲基化水平和覆蓋深度分別為：

其中，表示樣本n在甲基化位點(diǎn)上的正鏈甲基化水平，表示樣本n在甲基化位點(diǎn)上的負(fù)鏈甲基化水平，表示樣本n在甲基化位點(diǎn)上的正鏈覆蓋深度，表示樣本n在甲基化位點(diǎn)上的負(fù)鏈覆蓋深度，，；

將計(jì)算得到的各甲基化位點(diǎn)的甲基化水平和覆蓋深度進(jìn)行合并得到甲基化水平矩陣和位點(diǎn)深度矩陣，所述甲基化水平矩陣和位點(diǎn)深度矩陣均為I行N列矩陣，其中，行對(duì)應(yīng)甲基化位點(diǎn)，列對(duì)應(yīng)待測(cè)樣本。

4.如權(quán)利要求1或2所述的甲基化標(biāo)志物篩選與評(píng)價(jià)方法，其特征在于，在所述基于甲基化水平矩陣和位點(diǎn)深度矩陣，針對(duì)待測(cè)樣本中的每一個(gè)甲基化位點(diǎn)，分別計(jì)算其與下一甲基化位點(diǎn)之間的距離及甲基化水平的線性相關(guān)系數(shù)，并根據(jù)計(jì)算結(jié)果依次對(duì)相鄰甲基化位點(diǎn)進(jìn)行合并得到甲基化連鎖區(qū)域，將包含有預(yù)設(shè)數(shù)量甲基化位點(diǎn)的個(gè)甲基化連鎖區(qū)域作為甲基化標(biāo)志物候選區(qū)域輸出中，針對(duì)樣本n甲基化位點(diǎn)的甲基化連鎖區(qū)域合并步驟包括：

判斷甲基化位點(diǎn)及其下一甲基化位點(diǎn)的覆蓋深度是否均在預(yù)設(shè)最低深度要求之上；

若是，計(jì)算甲基化位點(diǎn)和甲基化位點(diǎn)之間的距離；

計(jì)算甲基化位點(diǎn)上各待測(cè)樣本的甲基化水平與甲基化位點(diǎn)上各待測(cè)樣本的甲基化水平之間的線性相關(guān)系數(shù)；其中，表示樣本1在甲基化位點(diǎn)上的甲基化水平，表示樣本N在甲基化位點(diǎn)上的甲基化水平，表示樣本1在甲基化位點(diǎn)上的甲基化水平，表示樣本N在甲基化位點(diǎn)上的甲基化水平；

判斷是否同時(shí)滿足條件和，其中，為預(yù)設(shè)最大位點(diǎn)間間距，為預(yù)設(shè)最小相關(guān)系數(shù)；

若是，將甲基化位點(diǎn)并入甲基化位點(diǎn)當(dāng)前所在的甲基化連鎖區(qū)域形成新的甲基化連鎖區(qū)域，否則斷開甲基化位點(diǎn)當(dāng)前所在的甲基化連鎖區(qū)域，。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于臻和（北京）生物科技有限公司;無錫臻和生物科技股份有限公司，未經(jīng)臻和（北京）生物科技有限公司;無錫臻和生物科技股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110078570.2/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】