[發(fā)明專利]一種基于目標(biāo)區(qū)域測序的單個外顯子拷貝數(shù)變異預(yù)測方法有效
| 申請?zhí)枺?/td> | 201810591504.3 | 申請日: | 2018-06-10 |
| 公開(公告)號: | CN108920899B | 公開(公告)日: | 2022-02-08 |
| 發(fā)明(設(shè)計)人: | 朱忠旭;周文莉;楊克勤;呂遠(yuǎn)棟 | 申請(專利權(quán))人: | 杭州邁迪科生物科技有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B20/20 |
| 代理公司: | 北京志霖恒遠(yuǎn)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11435 | 代理人: | 奚麗萍 |
| 地址: | 311305 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 目標(biāo) 區(qū)域 單個 外顯子 拷貝 變異 預(yù)測 方法 | ||
1.一種基于目標(biāo)區(qū)域測序的單個外顯子拷貝數(shù)變異預(yù)測方法,其特征在于:包括以下步驟:
(1)測序數(shù)據(jù)處理:
a.對樣本的目標(biāo)區(qū)域進行捕獲建庫,然后在二代測序儀中進行高通量測序,得到測序原始數(shù)據(jù);
b.通過開源比對工具,對測序得到的序列與參考基因組進行比對,得到測序序列在參考基因組上的位置和序列比對質(zhì)量;
c.根據(jù)序列在染色體上的位置,對位于相同起始位置和相同終止位置的序列只保留一條,并對序列按照染色體順序和起始位置順序進行排序;
(2)拷貝數(shù)變異預(yù)測:
a.統(tǒng)計覆蓋到目標(biāo)區(qū)域的測序序列總數(shù)目和堿基總數(shù)目:
以目標(biāo)區(qū)域為基礎(chǔ),以每個區(qū)域為單位,統(tǒng)計每個覆蓋到該區(qū)域的測序序列總數(shù)目和堿基總數(shù)目;
b.確定對照外顯子區(qū)域:
每個樣本選取至少30個以上的包含在目標(biāo)區(qū)域中且為不容易發(fā)生拷貝數(shù)變化的區(qū)域作為對照外顯子區(qū)域,每個樣本的對照外顯子區(qū)域與待分析外顯子區(qū)域一致;
c.標(biāo)準(zhǔn)化每個對照樣本和實驗樣本的待分析外顯子區(qū)域覆蓋度;
d.計算對照樣本中待分析外顯子區(qū)域標(biāo)準(zhǔn)化后的覆蓋度的平均值、標(biāo)準(zhǔn)差和變異系數(shù);
e.根據(jù)變異系數(shù)、實驗樣本待分析外顯子區(qū)域標(biāo)準(zhǔn)化后的覆蓋度偏離對照樣本標(biāo)準(zhǔn)化后的覆蓋度平均值與標(biāo)準(zhǔn)差的關(guān)系,預(yù)測待分析外顯子區(qū)域拷貝數(shù)變化。
2.根據(jù)權(quán)利要求1所述的基于目標(biāo)區(qū)域測序的單個外顯子拷貝數(shù)變異預(yù)測方法,其特征在于:
所述步驟(2)c步驟中標(biāo)準(zhǔn)化單個樣本的待分析外顯子區(qū)域的覆蓋度的具體方法如下:
對于特定樣本,其對照外顯子區(qū)域為m個,待分析外顯子區(qū)域為n個,第j個對照外顯子區(qū)域定義為ControlRegionj,j∈{1,2,3…m},其覆蓋的reads數(shù)目定義為region_readsj;第i個待分析外顯子區(qū)域定義為TestRegioni,i∈{1,2,3…n},其覆蓋的reads數(shù)目定義為region_readsi;
該樣本覆蓋到對照外顯子區(qū)域中的總reads數(shù)為:Total_readscontrol=∑region_readsj,j∈{1,2,3...m},該樣本待分析外顯子區(qū)域的覆蓋度標(biāo)準(zhǔn)化基數(shù)數(shù)值avr等于對照外顯子區(qū)域的總reads數(shù)Total_readscontrol除以對照區(qū)域總個數(shù)m:該樣本的待分析外顯子區(qū)域TestRegioni的標(biāo)準(zhǔn)化之后的覆蓋度為:
對照樣本數(shù)量為p個,第c個實驗樣本定義smpc,c∈{1,2,3,…p},根據(jù)上述方法標(biāo)準(zhǔn)化其每個待分析外顯子區(qū)域的覆蓋度,記為smpc_i;
實驗樣本數(shù)量為q個,第t個實驗樣本定義為smpt,t∈{1,2,3,…q},根據(jù)上述方法標(biāo)準(zhǔn)化其每個待分析外顯子區(qū)域的覆蓋度,記為smpt_i;
所述步驟(2)d步驟中計算對照樣本中待分析外顯子區(qū)域標(biāo)準(zhǔn)化后的覆蓋度的平均值、標(biāo)準(zhǔn)差和變異系數(shù)的具體方法如下:
對于p個對照樣本,待分析外顯子區(qū)域TestRegioni,i∈{1,2,3...n}的標(biāo)準(zhǔn)化之后的覆蓋度的平均值為:
標(biāo)準(zhǔn)差為:
變異系數(shù)為:
所述步驟(2)e步驟中根據(jù)變異系數(shù)、實驗樣本待分析外顯子區(qū)域標(biāo)準(zhǔn)化后的覆蓋度偏離對照樣本標(biāo)準(zhǔn)化后的覆蓋度平均值與標(biāo)準(zhǔn)差的關(guān)系,預(yù)測待分析外顯子區(qū)域拷貝數(shù)變化的具體方法如下:
如果CVi>0.2,這提示該區(qū)域變異較大,預(yù)測不可靠;如果CVi≤0.2,假設(shè)外顯子區(qū)域的覆蓋度在樣本之間的符合正態(tài)分布,則正態(tài)分布的均值為標(biāo)準(zhǔn)差為σi;則對于特定實驗樣本smpt,t∈{1,2,3,...q},其待分析外顯子區(qū)域數(shù)值偏離對照樣本覆蓋度平均值為:
如果|diffsmpt_i|≤2σi,則認(rèn)為沒有發(fā)生拷貝數(shù)變化;
如果|diffsmpt_i|>2σi,diffsmpt_i分大于0和小于0兩種情況:
第一種情況diffsmpt_i>0,可能為拷貝數(shù)增加情況,則預(yù)測為重復(fù)變異,并根據(jù)正態(tài)分布的密度函數(shù)計算樣本落入smpt_i至+∞區(qū)間內(nèi)的概率;第二種情況diffsmpt_i<0,可能為拷貝數(shù)減少情況,則預(yù)測為缺失變異,并根據(jù)正態(tài)分布的密度函數(shù)計算樣本落入-∞至區(qū)smpt_i間內(nèi)的概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州邁迪科生物科技有限公司,未經(jīng)杭州邁迪科生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810591504.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





