[發(fā)明專利]一種鑒定腫瘤細(xì)胞的染色體外環(huán)狀DNA組成基因的方法有效
| 申請?zhí)枺?/td> | 202110863650.9 | 申請日: | 2021-07-29 |
| 公開(公告)號: | CN113724788B | 公開(公告)日: | 2023-09-12 |
| 發(fā)明(設(shè)計)人: | 張瑩;董科顯;賈學(xué)淵;王冬;于景翠;白靜;傅松濱 | 申請(專利權(quán))人: | 哈爾濱醫(yī)科大學(xué) |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B40/00;G16B20/50;G16B20/20 |
| 代理公司: | 北京科龍寰宇知識產(chǎn)權(quán)代理有限責(zé)任公司 11139 | 代理人: | 孫皓晨 |
| 地址: | 150086 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 鑒定 腫瘤 細(xì)胞 染色 體外 環(huán)狀 dna 組成 基因 方法 | ||
1.一種鑒定腫瘤細(xì)胞的染色體外環(huán)狀DNA組成基因的方法,其特征在于,包括以下步驟:
步驟1:通過illumina平臺對待分析樣本進(jìn)行全基因組二代測序,得到過濾后滿足條件的fastq格式文件的二代測序結(jié)果,并進(jìn)行質(zhì)控;
步驟2:通過CNVkit對步驟1中二代測序結(jié)果進(jìn)行拷貝數(shù)變異統(tǒng)計,并對得到的cnr文件進(jìn)行均一化處理;
步驟3:通過AmpliconArchitect軟件進(jìn)行染色體外DNA的結(jié)構(gòu)預(yù)測,并根據(jù)hg19參考基因組得到染色體外環(huán)狀DNA在基因坐標(biāo)軸的范圍以及對應(yīng)范圍上所包含基因;
步驟4:通過Delly軟件進(jìn)行SV分析,并對得到的vcf格式的結(jié)果文件進(jìn)一步進(jìn)行篩選;
步驟5:將步驟4得到的結(jié)果與步驟2得到的結(jié)果結(jié)合后,與步驟3的結(jié)果取交集,得到一區(qū)域交界處的接頭序列,然后將環(huán)狀結(jié)構(gòu)進(jìn)行組裝得到一樣本;
步驟6:對組裝后得到的樣本進(jìn)行Pacbio長序列測序,并與hg19參考基因組比對后得到比對后的第二bam文件,再進(jìn)行篩選校正;
步驟7:將步驟5中組裝后的樣本序列重命名并加入到hg19參考基因組,再次進(jìn)行比對以確認(rèn)是否為染色體外環(huán)狀DNA。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟1具體為:
步驟11:采用barcode+NGS的方式進(jìn)行全基因組二代測序,具體為通過illumina平臺對待分析樣本進(jìn)行全基因組二代測序,再通過腳本程序在得到的fastq文件中提取umi序列,對提取到的所有umi序列進(jìn)行聚類和信息統(tǒng)計分析,將支持?jǐn)?shù)的相同的umi序列進(jìn)行合并;
步驟12:根據(jù)統(tǒng)計分析結(jié)果將測序得到的序列中相同的barcode的序列合并,將合并后的集合作為一致性序列的集合,并在集合內(nèi)修正因PCR和測序誤差對reads本身的影響;
步驟13:通過BWA軟件對提取后的fastq文件與hg19參考基因組進(jìn)行比對,得到比對后第一bam格式文件。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟1中的質(zhì)控標(biāo)準(zhǔn)具體為去除N的比例大于10%的reads,其中N為未成功識別到的堿基。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟2中均一化處理的算法具體為:
步驟21:將第一bam文件通過pysam選取10kb為一個bin,計算所有bin的平均覆蓋度,排除覆蓋度為0或者覆蓋度大于5倍整體平均覆蓋度方差的區(qū)域;
步驟22:重新計算平均覆蓋度、方差及標(biāo)準(zhǔn)差,并通過下式計算得到任一窗口區(qū)域的高斯核函數(shù)參數(shù),
式中,j代表迭代次數(shù),ri,rj代表窗口區(qū)域中的任意兩個bin即bin?i和bin?j,Hb為bin的位序,Hr為bin的帶寬,norm表示恒定系數(shù);
步驟23:當(dāng)ΔF為大于0時,認(rèn)定對應(yīng)區(qū)域為一個邊界;當(dāng)ΔF小于0時,將對應(yīng)區(qū)域合并到下一個區(qū)域,繼續(xù)根據(jù)上式進(jìn)行迭代,以得到篩選區(qū)域,其中,ΔF為當(dāng)前計算的高斯核函數(shù)參數(shù)的值與上一次計算的高斯核函數(shù)參數(shù)的值的差值;
步驟24:在cnr文件中對篩選出來的區(qū)域進(jìn)行K-mean聚類得到cns文件,并選取Copynumber5,Length100的區(qū)域作為bed文件候選區(qū)域,其中,Copynumber為拷貝數(shù),Length為長度。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟3具體為:
步驟31:通過AmpliconArchitect軟件對步驟13得到的第一bam文件進(jìn)行染色體外DNA的結(jié)構(gòu)預(yù)測;
步驟32:當(dāng)測序深度5X時通過向下采樣將深度調(diào)整為5X,并使用hg19參考基因組得到染色體外環(huán)狀DNA在基因坐標(biāo)軸的范圍,其中X為倍數(shù);
步驟33:得到基因坐標(biāo)軸的范圍上所包含的基因。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱醫(yī)科大學(xué),未經(jīng)哈爾濱醫(yī)科大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110863650.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種高效免疫活性細(xì)胞群制備及用于抗腫瘤的方法
- 獲得和使用內(nèi)胚層和肝細(xì)胞的組合物和方法
- bumetanide在抑制腫瘤細(xì)胞增殖中的應(yīng)用
- 細(xì)胞陣列計算系統(tǒng)以及其中細(xì)胞之間的通信方法
- 細(xì)胞陣列計算系統(tǒng)以及其中細(xì)胞間群發(fā)通信方法
- 獲得和使用內(nèi)胚層和肝細(xì)胞的組合物和方法
- 用于自動生成遺傳修飾的T細(xì)胞的方法
- 細(xì)胞核圖像輪廓捕獲設(shè)備及其方法
- 細(xì)胞結(jié)構(gòu)體及細(xì)胞結(jié)構(gòu)體的制造方法
- 一種懸浮細(xì)胞培養(yǎng)中去除死細(xì)胞的方法





