[發(fā)明專利]基于高通量測序分析拷貝數(shù)變異的方法在審
| 申請?zhí)枺?/td> | 202010664503.4 | 申請日: | 2020-07-10 |
| 公開(公告)號: | CN111755069A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設(shè)計)人: | 姬云;孫石磊;王玨;王晶晶 | 申請(專利權(quán))人: | 蘇州科貝生物技術(shù)有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B30/00 |
| 代理公司: | 蘇州創(chuàng)元專利商標(biāo)事務(wù)所有限公司 32103 | 代理人: | 孫周強 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 通量 分析 拷貝 變異 方法 | ||
本發(fā)明公開了基于高通量測序分析拷貝數(shù)變異的方法,將全基因組高通量測序數(shù)據(jù)進行數(shù)據(jù)處理,完成拷貝數(shù)變異的分析;所述數(shù)據(jù)處理包括參考基因組比對、分級計數(shù)、內(nèi)參歸一化、外參歸一化、染色體特征值提取及匯總,將每組染色體的特征值A(chǔ)加和,得到整體染色體異常特征值B;當(dāng)特征值B范圍為1~8時,長臂和斷臂缺失或增加異常程度低;當(dāng)特征值B范圍大于8時,長臂和斷臂缺失或增加異常程度高;從而完成拷貝數(shù)變異的分析。本發(fā)明可以處理嚴重降解樣品及石蠟包埋樣品DNA,數(shù)據(jù)結(jié)果客觀,結(jié)果判斷對人員要求低,可發(fā)現(xiàn)低豐度細胞發(fā)生缺失,費用較低。
技術(shù)領(lǐng)域
本發(fā)明屬于基因檢測技術(shù),具體涉及基于高通量測序分析拷貝數(shù)變異的方法。
背景技術(shù)
拷貝數(shù)變異(copy number variation,CNV)包括顯微水平和亞顯微水平的變異。顯微水平的變異是染色體長臂和短臂缺失、增加等畸變,亞顯微水平是1Kb以上的DNA缺失、增加等的變異。研究表明,多數(shù)拷貝數(shù)變異都是體內(nèi)正常基因組變異的部分。現(xiàn)有檢測CNV的大多是基于聚合酶鏈反應(yīng)的技術(shù),如實時熒光PCR、熒光原位雜交、染色體微陣列芯片技術(shù)等方法,這些方法最大的問題是覆蓋范圍有限,難以全面提供變異共區(qū)段信息。二代測序技術(shù)的出現(xiàn),使測序通量和分辨率提升,成本也大大降低,同時也出現(xiàn)了一些基于全基因組測序的CNV數(shù)據(jù)計算方法,如PatternCNV、Ioncopy、cnvkit等,這些方法都是依賴于測序深度及GC含量,對分析算法參數(shù)設(shè)置有一定限制,分析成本高,操作流程也較復(fù)雜。
發(fā)明內(nèi)容
本發(fā)明公開了新的基于高通量測序分析拷貝數(shù)變異的方法及用于該方法的系統(tǒng),對全基因組進行隨機測序,覆蓋位點較多;可以處理嚴重降解樣品及石蠟包埋樣品DNA,數(shù)據(jù)結(jié)果客觀,結(jié)果判斷對人員要求低,可發(fā)現(xiàn)低豐度細胞發(fā)生缺失,費用較低。
目前市場上檢測染色體長臂和斷臂缺失或增加異常程度的方法存在缺陷,本發(fā)明涉及一種針對組織樣本進行全基因測序及數(shù)據(jù)分析的方法,具體地,是提供一種低深度測序分析方法,檢測染色體不穩(wěn)定的分布特征,公開了全基因組測序數(shù)據(jù)分析方法,覆蓋范圍廣,準(zhǔn)確度高,價格合理,數(shù)據(jù)處理方法新穎,能較好地區(qū)分染色體異常程度。
本發(fā)明采用如下技術(shù)方案:
基于高通量測序分析拷貝數(shù)變異的方法,包括以下步驟,將全基因組高通量測序數(shù)據(jù)進行數(shù)據(jù)處理,完成拷貝數(shù)變異的分析;所述數(shù)據(jù)處理包括參考基因組比對、分級計數(shù)、內(nèi)參歸一化、外參歸一化、染色體特征值提取及匯總。
本發(fā)明公開了用于上述基于高通量測序分析拷貝數(shù)變異的方法的系統(tǒng),包括依次相連的序列比對模塊、分級計數(shù)模塊、內(nèi)參歸一化模塊、外參歸一化模塊、染色體特征值提取及匯總模塊;其中,序列比對模塊將測序后的數(shù)據(jù)reads利用軟件BWA比對至參考基因組;分級計數(shù)模塊將參考基因組按照固定區(qū)段劃分為各區(qū)段,再統(tǒng)計分布于各區(qū)段的reads的數(shù)量;內(nèi)參歸一化模塊將各區(qū)段的reads數(shù)量之和除以reads的數(shù)量總和,得到各區(qū)段reads相對比例,存儲于文件B中;外參歸一化模塊將文件B中的各區(qū)段reads相對比例與標(biāo)準(zhǔn)文件C中對應(yīng)區(qū)段的reads相對比例相除,得到各區(qū)段增加或缺失的相對值;染色體特征值提取及匯總模塊按照人染色體分組,每個組按如下規(guī)則提取特征值,不滿足要求則不提取特征值:
(1)至少連續(xù)3個區(qū)段處于連續(xù)同向且連續(xù)區(qū)段位于短臂或長臂范圍內(nèi),不跨越各染色體著絲粒,符合的連續(xù)區(qū)段稱為計數(shù)區(qū)段;
(2)計數(shù)區(qū)段中,各區(qū)段變異系數(shù)不大于0.5;
(3) 特征值A(chǔ)不小于4.5;
(4)特征值A(chǔ)為最大值;
(5)符合規(guī)則的區(qū)段最多計數(shù)一次;
特征值A(chǔ)=計數(shù)區(qū)段的數(shù)量×計數(shù)區(qū)段的平均相對值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州科貝生物技術(shù)有限公司,未經(jīng)蘇州科貝生物技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010664503.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





