[發(fā)明專利]一種基于三代測(cè)序平臺(tái)的HLA基因分型方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810191663.4 | 申請(qǐng)日: | 2018-03-08 |
| 公開(公告)號(hào): | CN108460246B | 公開(公告)日: | 2022-02-22 |
| 發(fā)明(設(shè)計(jì))人: | 郎娜;金杰;龔淳;楊帆;周家蓬;汪德鵬 | 申請(qǐng)(專利權(quán))人: | 北京希望組生物科技有限公司 |
| 主分類號(hào): | G16B30/10 | 分類號(hào): | G16B30/10;C12Q1/6869 |
| 代理公司: | 北京紀(jì)凱知識(shí)產(chǎn)權(quán)代理有限公司 11245 | 代理人: | 陸惠中;王永偉 |
| 地址: | 102206 北京市昌平區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 三代測(cè)序 平臺(tái) hla 基因 方法 | ||
1.一種基于三代測(cè)序平臺(tái)的HLA基因分型方法,包括以下步驟:
(1)對(duì)需要分型的HLA基因進(jìn)行PCR擴(kuò)增;
(2)PCR所得產(chǎn)物檢測(cè)合格后,進(jìn)行三代測(cè)序,獲得原始數(shù)據(jù);
(3)將原始數(shù)據(jù)與參考基因序列進(jìn)行長(zhǎng)序列比對(duì),所述參考基因序列為IPD-IMGT/HLA數(shù)據(jù)庫中的一條最長(zhǎng)序列;
(4)比對(duì)后采用如下程序?qū)y(cè)序錯(cuò)誤進(jìn)行矯正:
(4.1)編碼原始比對(duì)矩陣
經(jīng)過和參考序列的比對(duì),所述HLA基因組成了由堿基構(gòu)成的特有矩陣;使用samtools軟件的tview命令,輸出文本格式的堿基與參考基因序列的比對(duì)矩陣;以參考基因的位置為橫坐標(biāo)、以i表示,以深度為縱坐標(biāo)、以j表示,矩陣組成單元以x表示;
設(shè)置初始閾值y,所述y表示默認(rèn)的錯(cuò)誤率,所述錯(cuò)誤率為測(cè)序錯(cuò)誤占總深度的比例,所述錯(cuò)誤率為10%;
每個(gè)i位置的堿基縱向的總深度為Dep_total[i];
統(tǒng)計(jì)每個(gè)i位置對(duì)應(yīng)的所有j位置x的數(shù)量,記為Dep(x);
(4.2)純合、雜合位點(diǎn)的可視化矯正
(4.2.1)設(shè)置初始錯(cuò)誤率閾值y,所述y為10%;
(4.2.2)確定擴(kuò)增子雜合等位型j位置及比例;
對(duì)于每個(gè)i位置,當(dāng)Dep(x)y,使用Dep(x1)代表最大深度堿基類型的深度,僅次于Dep(x1)的深度,用Dep(x2)表示,若有第三大堿基類型的深度,為Dep(x3);
對(duì)整個(gè)擴(kuò)增子的雜合比例進(jìn)行計(jì)算,當(dāng)Dep(x2)/(Dep(x1)+Dep(x2))20%時(shí),假設(shè)其為純合子;當(dāng)Dep(x2)/(Dep(x1)+Dep(x2))=20%時(shí),假設(shè)其為雜合二倍型別,選取SNV等位型雜合比最接近0.5的四個(gè)點(diǎn),該四個(gè)點(diǎn)依照以下規(guī)則選取:
以δi衡量SNV等位型雜合比與0.5的接近程度,
δi=(Dep(x1)/Dep_total[i]-0.5)2+(Dep(x2)/Dep_total[i]-0.5)2;選取δi最小的四個(gè)i位置;
且該四個(gè)i位置前后兩個(gè)位置的Dep(*)小于總深度的20%,否則繼續(xù)根據(jù)δi篩選;
根據(jù)該四個(gè)i位置確定矩陣中每個(gè)j位置的連鎖相:
(4.2.2.1)對(duì)于矩陣中四個(gè)雜合位點(diǎn),即上述的四個(gè)i位置,第一個(gè)雜合位點(diǎn)i位置最大深度Dep(x1)的堿基類型對(duì)應(yīng)的矩陣的j位置為相位1,第二大深度Dep(x2)的堿基類型對(duì)應(yīng)的矩陣的j位置為相位2,確定第一個(gè)雜合位點(diǎn)的不需要矯正的j坐標(biāo)的相位;
(4.2.2.2)第二個(gè)雜合位點(diǎn)的相位根據(jù)第一個(gè)雜合位點(diǎn)的每一個(gè)j坐標(biāo)的相位情況確定:
若相位1對(duì)應(yīng)的堿基類型有80%為該i位置的最大深度Dep(x1)的堿基類型,且相位2對(duì)應(yīng)的堿基類型有80%為該i位置的第二大深度Dep(x2)的堿基類型,則最大深度Dep(x1)的堿基類型對(duì)應(yīng)的矩陣的j位置為相位1,第二大深度Dep(x2)的堿基類型對(duì)應(yīng)的矩陣的j位置為相位2;
若相位1對(duì)應(yīng)的堿基類型有80%為該i位置的最大深度Dep(x2)的堿基類型,且相位2對(duì)應(yīng)的堿基類型有80%為該i位置的最大深度Dep(x1)的堿基類型,則第二大深度Dep(x2)的堿基類型對(duì)應(yīng)的矩陣的j位置為相位1,最大深度Dep(x1)的堿基類型對(duì)應(yīng)的矩陣的j位置為相位2;
若滿足以上兩個(gè)條件,則根據(jù)該方法確定其它雜合位點(diǎn)的連鎖相;若以上兩個(gè)條件不都滿足,繼續(xù)根據(jù)第三個(gè)位點(diǎn)分別和第一個(gè)雜合位點(diǎn)、第二個(gè)雜合位點(diǎn)進(jìn)行判斷;滿足(4.2.2.2)要求的雜合位點(diǎn),共同確定連鎖相,不滿足(4.2.2.2)所述要求的雜合位點(diǎn)被作為純合位點(diǎn);第四個(gè)i位置,依照此方法,對(duì)前面三個(gè)點(diǎn)進(jìn)行驗(yàn)證和對(duì)不確定相位的j位置補(bǔ)缺;
對(duì)于該四個(gè)雜合位點(diǎn),相位1對(duì)應(yīng)的j位置組成數(shù)組j(phase1),相位2對(duì)應(yīng)的j位置組成數(shù)組j(phase2);以相位1對(duì)應(yīng)的基因型的深度為Dep(phase1),以相位2對(duì)應(yīng)的基因型的深度為Dep(phase2),計(jì)算雜合基因型的比例Rh:
Rh=Dep(phase1)/[Dep(phase1)+Dep(phase2)];
(4.2.3)確定純合位點(diǎn)與雜合位點(diǎn);
對(duì)于每個(gè)i位置,滿足以下任意一種情況,則為雜合位點(diǎn):
①Dep(x1)對(duì)應(yīng)的堿基j位置至少80%屬于數(shù)組j(phase1),Dep(x2)對(duì)應(yīng)的堿基j位置至少80%屬于數(shù)組j(phase2);
②Dep(x1)對(duì)應(yīng)的堿基j位置至少80%屬于數(shù)組j(phase2),Dep(x2)對(duì)應(yīng)的堿基j位置至少80%屬于數(shù)組j(phase1);
否則為純合位點(diǎn);
根據(jù)矩陣中雜合位點(diǎn)j位置的連鎖相的判斷,對(duì)純合、雜合位點(diǎn)再次驗(yàn)證調(diào)整;初步確定該擴(kuò)增子或基因?yàn)榧兒蠁误w型還是雜合二倍型;
(4.2.4)堿基矯正
對(duì)于純合位點(diǎn),該i位置調(diào)整y=Dep(x2);當(dāng)Dep(x)=y(tǒng),則該處ij坐標(biāo)的堿基被矯正為最大深度Dep(x1)的堿基類型;
對(duì)于雜合位點(diǎn),該i位置調(diào)整y=Dep(x3);當(dāng)Dep(x)=y(tǒng),則該處ij坐標(biāo)將根據(jù)其連鎖相,從而決定該處ij坐標(biāo)的堿基被矯正為最大深度Dep(x1)的堿基或第二大深度Dep(x2)的堿基;
(4.2.5)輸出后驗(yàn)矩陣
(5)分相得到單體型序列
對(duì)矯正后的矩陣進(jìn)行序列讀取;
根據(jù)(4.2.3)確定該擴(kuò)增子為純合單體型或雜合二倍型,若為純合單體型,輸出最大深度的一條單體型序列;否則根據(jù)(4.2.3)確定的每個(gè)j位置的連鎖相,對(duì)校正后的序列按照相位1和相位2歸類;輸出最大深度的兩條單體型序列,以兩條單體型序列深度為單位,和對(duì)應(yīng)(4.2.2.2)中的Dep(phase1)、Dep(phase2)進(jìn)行卡方檢驗(yàn),確定該擴(kuò)增子為純合單體型或雜合二倍型,輸出一致性序列;
(6)分型判斷
(6.1)根據(jù)比對(duì)位置,確定單體型序列的每個(gè)外顯子編號(hào)及對(duì)應(yīng)的堿基序列;對(duì)于每條單體型序列,根據(jù)外顯子匹配度輸出完全匹配結(jié)果result1,否則輸出最佳匹配的6位分型結(jié)果result1;
(6.2)進(jìn)一步對(duì)單體型全長(zhǎng)匹配打分
若IPD-IMGT/HLA數(shù)據(jù)庫中基因全長(zhǎng)序列文件hla_gen.fasta,有result1的分型,則將單體型中內(nèi)含子的序列,與數(shù)據(jù)庫中的參考序列進(jìn)行匹配打分;
給出最佳8位分型結(jié)果result2,若突變則標(biāo)記為新的型別result2。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京希望組生物科技有限公司,未經(jīng)北京希望組生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810191663.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種核酸第三代測(cè)序原始數(shù)據(jù)的處理方法及其應(yīng)用
- 三代測(cè)序數(shù)據(jù)糾錯(cuò)的方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 確定胎兒脊髓性肌肉萎縮癥基因單體型的方法及系統(tǒng)
- 確定胎兒Duchenne型肌營(yíng)養(yǎng)不良基因單體型的方法及系統(tǒng)
- 確定胎兒beta地中海貧血基因單體型的方法及系統(tǒng)
- 確定胎兒alpha地中海貧血基因單體型的系統(tǒng)
- 一種基于DNA變異檢測(cè)的三代數(shù)據(jù)校正方法
- 綜合應(yīng)用第三代超長(zhǎng)測(cè)序讀段和第二代鏈接式讀段從頭組裝基因組的方法
- 第三代測(cè)序用標(biāo)簽序列、接頭序列、試劑盒和第三代測(cè)序建庫方法
- 無參考基因組序列的轉(zhuǎn)錄組分析方法及系統(tǒng)
- 用于激活輔助性T細(xì)胞的方法
- HLA基因在判斷中國(guó)漢族婦女外陰白色病變中的應(yīng)用
- 用HLA等位基因評(píng)估抗癲癇藥物苯妥英引發(fā)藥物過敏反應(yīng)的方法
- 用于激活輔助性T細(xì)胞的方法
- 一種熒光PCR熔解曲線法檢測(cè)HLA基因型的試劑盒
- 抗HLA-DQ2.5抗體
- 無內(nèi)源HLA基因背景的抗原遞呈細(xì)胞系的構(gòu)建方法、抗原遞呈細(xì)胞系及其用途
- HLA基因分型的方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 原發(fā)性肝癌相關(guān)抗原的胸腺依賴性淋巴細(xì)胞抗原表位肽及其應(yīng)用
- 檢測(cè)HLA雜合性缺失的方法及系統(tǒng)





