[發(fā)明專(zhuān)利]基于生物信息學(xué)富集胎兒游離DNA用于拷貝數(shù)變異的分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110397074.3 | 申請(qǐng)日: | 2021-04-13 |
| 公開(kāi)(公告)號(hào): | CN113270138B | 公開(kāi)(公告)日: | 2023-09-22 |
| 發(fā)明(設(shè)計(jì))人: | 許雄;胡大輝;丁琳楓;肖銳;李海波;施丹華;田麗蘊(yùn);徐軍;邱海燕 | 申請(qǐng)(專(zhuān)利權(quán))人: | 杭州博圣醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室有限公司;寧波市婦女兒童醫(yī)院 |
| 主分類(lèi)號(hào): | G16B5/00 | 分類(lèi)號(hào): | G16B5/00;G16B20/20;G16B20/30 |
| 代理公司: | 杭州求是專(zhuān)利事務(wù)所有限公司 33200 | 代理人: | 鄭海峰 |
| 地址: | 310030 浙江省杭州市西湖區(qū)三*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 生物 信息學(xué) 富集 胎兒 游離 dna 用于 拷貝 變異 分析 方法 | ||
本發(fā)明公開(kāi)了一種基于生物信息學(xué)富集胎兒游離DNA用于拷貝數(shù)變異的分析方法。本發(fā)明選擇性挑選雙端都比對(duì)到參考基因組的主要來(lái)自于胎兒的短片段reads,本發(fā)明通過(guò)計(jì)算不同片段長(zhǎng)度的均一化后性染色體reads數(shù)占總常染色體reads數(shù)的占比計(jì)算胎兒DNA含量,選取胎兒DNA含量最高的游離DNA片段長(zhǎng)度范圍做后續(xù)非整倍體和CNV分析。本發(fā)明可以提高胎兒DNA濃度比例,對(duì)于分析胎兒染色體非整倍性、染色體片段拷貝數(shù)異常等應(yīng)用的準(zhǔn)確性有極大提高。
技術(shù)領(lǐng)域
本發(fā)明屬于基于NGS測(cè)序的無(wú)創(chuàng)產(chǎn)前篩查應(yīng)用生物信息數(shù)據(jù)分析領(lǐng)域,具體涉及一種基于生物信息學(xué)富集胎兒游離DNA用于拷貝數(shù)變異的分析方法。
背景技術(shù)
1997年,香港中文大學(xué)的Denise?Lo發(fā)現(xiàn)血液中存在來(lái)自于胎兒的游離DNA片段,其平均含量大概占母血中總游離DNA含量的13%。通過(guò)對(duì)懷孕12周以上的孕婦外周血中游離DNA片段分離提取,采用大規(guī)模平行測(cè)序方法,可準(zhǔn)確檢測(cè)胎兒的染色體和片段拷貝數(shù)異常、性別判定、單基因病篩查等。
目前胎兒游離DNA富集主要通過(guò)電泳分離法或磁珠富集的實(shí)驗(yàn)方法。但由于胎兒的游離DNA片段含量極低,很難分離不同長(zhǎng)度的游離DNA片段,且還會(huì)造成樣本損失。兩種富集方法還增加了實(shí)驗(yàn)的復(fù)雜度和建庫(kù)時(shí)間周期的延長(zhǎng),這兩種方法產(chǎn)生的數(shù)據(jù)會(huì)使比對(duì)上的reads冗余度升高,同時(shí)reads在參考基因組上的分布均一性變差,可導(dǎo)致假陽(yáng)性率增加。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,考慮隨著下一代測(cè)序成本的降低,在一定范圍內(nèi)增加測(cè)序量,盡可能抽取來(lái)自于胎兒的DNA分子,通過(guò)生物信息篩選的方法,提高胎兒DNA占比,從而對(duì)分析胎兒染色體非整倍體和染色體片段CNV有更高的準(zhǔn)確性,同時(shí)能夠減少因胎兒DNA含量不足帶來(lái)的重上機(jī)或重采血的比例,檢測(cè)的樣本合格率更高,從而進(jìn)一步降低成本。
因?yàn)樘貉獫{游離DNA比母親游離DNA片段偏短,在不改變實(shí)驗(yàn)提取DNA和建庫(kù)方法的前提下,我們?cè)跍y(cè)序數(shù)據(jù)層面通過(guò)雙末端測(cè)序,基于兩條reads比對(duì)到參考基因組上的位置計(jì)算片段長(zhǎng)度分布。基于片段長(zhǎng)度分布,以10bp為step,分別挑選50-200,50-210,50-220,50-230,50-240,50-250;60-200,60-210,60-220,60-230,60-240,60-250;…,120-200,120-210,120-220,120-230,120-240,120-250…游離DNA片段長(zhǎng)度位于這些區(qū)域內(nèi)的reads,對(duì)每個(gè)樣本計(jì)算每條染色體上和每個(gè)滑動(dòng)窗口內(nèi)的reads數(shù)、GC,并對(duì)每個(gè)樣本的reads數(shù),用總比對(duì)到常染色體的reads數(shù)做均一化處理。
通過(guò)計(jì)算不同片段長(zhǎng)度的均一化后性染色體reads數(shù)占總常染色體reads數(shù)的占比計(jì)算胎兒DNA含量,選取胎兒DNA含量最高的游離DNA片段長(zhǎng)度范圍做后續(xù)非整倍體和CNV分析
對(duì)于常染色體和女性胎兒X染色體,通過(guò)計(jì)算出來(lái)的CNV的拷貝數(shù)減掉正常拷貝數(shù)2,乘以100%即可得到此CNV的嵌合比例(MosRatio);對(duì)于男性胎兒的X染色體和Y染色體,通過(guò)計(jì)算出來(lái)的CNV的拷貝數(shù)減掉正常拷貝數(shù)1,乘以100%即可得到此CNV的嵌合比例。如果此嵌合比例小于50%,一般反映的是胎兒DNA含量的大小,與胎兒DNA含量成正相關(guān)。如果當(dāng)前樣本有較多的CNV(可能包含良性和致病性CNV),所有CNV的嵌合比例的中位數(shù)與胎兒DNA含量近似相當(dāng)。
本發(fā)明的具體可選方案:
本發(fā)明公開(kāi)了一種基于生物信息學(xué)富集胎兒游離DNA的分析方法,其包括如下步驟:
1)將雙端reads不容錯(cuò)比對(duì)到參考基因組,記錄比對(duì)到參考基因組上的染色體、坐標(biāo)位置和reads的GC;
2)保留雙端都比對(duì)到參考基因組,且insert?size在1kb以內(nèi)的reads;所述insertsize指一對(duì)比對(duì)到參考基因組上的reads的雙末端的距離;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于杭州博圣醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室有限公司;寧波市婦女兒童醫(yī)院,未經(jīng)杭州博圣醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室有限公司;寧波市婦女兒童醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110397074.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種生物信息學(xué)高性能計(jì)算平臺(tái)的信息化管理設(shè)計(jì)方法
- 使用生物信息學(xué)字符集和和映射的生物信息學(xué)字體的基因組/蛋白質(zhì)組序列的表示、可視化,比較以及報(bào)告
- 在高性能集群系統(tǒng)中安裝生物信息學(xué)類(lèi)應(yīng)用程序的方法
- 基于物聯(lián)網(wǎng)的移動(dòng)護(hù)理信息學(xué)教學(xué)實(shí)驗(yàn)系統(tǒng)
- 一種生物信息學(xué)高性能計(jì)算平臺(tái)的測(cè)試方法
- 一種生物信息學(xué)高性能計(jì)算平臺(tái)的存儲(chǔ)配置以及優(yōu)化策略
- 一種測(cè)試生物信息學(xué)計(jì)算平臺(tái)性能的方法
- 一種材料信息學(xué)中的材料數(shù)據(jù)管理系統(tǒng)及方法
- 基因組/蛋白質(zhì)組序列的表示、可視化,比較以及報(bào)告
- 一種生物信息學(xué)高性能計(jì)算平臺(tái)的測(cè)試方法





