[發(fā)明專利]基于reads深度進(jìn)行目的基因外顯子水平重排檢測的方法及裝置有效
| 申請?zhí)枺?/td> | 202110707105.0 | 申請日: | 2021-06-24 |
| 公開(公告)號: | CN113284557B | 公開(公告)日: | 2021-10-15 |
| 發(fā)明(設(shè)計(jì))人: | 樓峰;劉凱;馬紀(jì)香;張萌萌;郭璟;孫宏;曹善柏 | 申請(專利權(quán))人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;天津橡鑫醫(yī)療器械有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B20/00;G16B45/00;G16B50/30 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 金田蘊(yùn) |
| 地址: | 102600 北京市大興區(qū)經(jīng)濟(jì)技*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 reads 深度 進(jìn)行 目的 基因 外顯子 水平 重排 檢測 方法 裝置 | ||
1.一種基于reads深度進(jìn)行目的基因外顯子水平重排檢測的方法,其特征在于,包括:
S1,將參考基因組劃分為多個(gè)bin,根據(jù)目的基因分為target區(qū)域的bin和off-target區(qū)域的bin,將reads比對到所述參考基因組上,并分別計(jì)算target區(qū)域和off-target區(qū)域的每個(gè)bin內(nèi)的平均reads深度和深度的log2值;
S2,合并target區(qū)域和off-target區(qū)域reads深度統(tǒng)計(jì),并將其標(biāo)準(zhǔn)化;
S3,對所述S2中標(biāo)準(zhǔn)化的結(jié)果進(jìn)行拷貝數(shù)變異查找,對于標(biāo)準(zhǔn)化后得到的log2根據(jù)閾值進(jìn)行定義目的基因的缺失和重復(fù)狀態(tài);
所述S2中的標(biāo)準(zhǔn)化包括:利用搭建好的reference數(shù)據(jù)庫進(jìn)行標(biāo)準(zhǔn)化,校正測序基因組GC含量、重復(fù)序列和目標(biāo)區(qū)域的密度從而校正bin 深度,所述reference數(shù)據(jù)庫是用N個(gè)健康人比對軟件的輸出結(jié)果Bam文件構(gòu)建的,包括健康人的reads深度統(tǒng)計(jì)及l(fā)og2標(biāo)準(zhǔn)化值、基因組的GC、重復(fù)序列和目標(biāo)區(qū)域的密度,所述N≥20;
所述S2中的標(biāo)準(zhǔn)化中,Off-target區(qū)域是根據(jù)參考基因組fa進(jìn)行擴(kuò)展獲得的包括端粒在內(nèi)的全部參考基因組序列和target區(qū)域進(jìn)行篩選得到的Off-target區(qū)域;利用如下公式校正bin深度,減去reference數(shù)據(jù)庫的深度的log2值,滑動(dòng)居中l(wèi)og2比率;,其中,第i個(gè)bin標(biāo)準(zhǔn)化后的reads數(shù)量定義為Ai,Ci是第i個(gè)bin中的read的數(shù)量,M是具有正常拷貝數(shù)的bin的預(yù)期reads計(jì)數(shù),αi為GC不同含量評估值,βi為mappability評估值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于reads深度進(jìn)行目的基因外顯子水平重排檢測的方法還包括:S4,篩選劃分不同bin中的目的基因的區(qū)域,進(jìn)行過濾其他bin,合并目的基因的檢測結(jié)果,利用所述標(biāo)準(zhǔn)化后的reads深度分布進(jìn)行可視化展示。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述bin為外顯子水平的bin。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述S1具體包括:將所述參考基因組長度設(shè)置為n,平均劃分為m個(gè)bin,則每一個(gè)bin長度為n/m;如果Ci是i個(gè)bin中的reads的數(shù)量,那么所有reads數(shù)據(jù)量是:,并由此計(jì)算target區(qū)域和off-target區(qū)域的每個(gè)bin內(nèi)的平均reads深度和深度的log2值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目的基因?yàn)锽RCA1/2,所述S3中對于標(biāo)準(zhǔn)化后得到的log2根據(jù)閾值進(jìn)行定義目的基因的缺失狀態(tài)包括:Log2值小于-0.4定義為cn=1,為雜合缺失;Log2值小于-1.1定義為cn=0,為純合缺失,Log2值大于0.7定義為擴(kuò)增。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;天津橡鑫醫(yī)療器械有限公司,未經(jīng)北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;天津橡鑫醫(yī)療器械有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110707105.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種智能控制充氣的氣艇
- 下一篇:一種染整過程中使用的廢水處理裝置





