[發(fā)明專利]用于計算癌癥樣本純度和染色體倍性的方法和裝置有效
| 申請?zhí)枺?/td> | 201710312237.7 | 申請日: | 2017-05-05 |
| 公開(公告)號: | CN108804876B | 公開(公告)日: | 2022-03-15 |
| 發(fā)明(設(shè)計)人: | 黃宇;羅志輝;蘇瑤;范新平 | 申請(專利權(quán))人: | 中國科學(xué)院上海藥物研究所 |
| 主分類號: | G16B20/10 | 分類號: | G16B20/10;G16B30/00;G16B40/00;G16B50/30 |
| 代理公司: | 北京金信知識產(chǎn)權(quán)代理有限公司 11225 | 代理人: | 張皓;徐琳 |
| 地址: | 201203 上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 計算 癌癥 樣本 純度 染色體 方法 裝置 | ||
本發(fā)明提供了一種全自動、高效率、高準(zhǔn)確性的計算癌癥樣本純度和染色體倍性的方法和裝置。通過本發(fā)明提供的層次混合高斯模型,實現(xiàn)了對癌癥樣本純度和染色體倍性的快速和準(zhǔn)確計算,節(jié)約了純度估算的時間和經(jīng)濟成本,同時提高了計算結(jié)果的準(zhǔn)確性。本發(fā)明在癌癥樣本純度和染色體倍性計算上具有廣闊的運用前景。
技術(shù)領(lǐng)域
本發(fā)明屬于癌癥研究領(lǐng)域,具體涉及用于計算癌癥樣本中癌癥細胞純度和細胞內(nèi)染色體倍性的方法和裝置。
背景技術(shù)
癌癥的研究是生命醫(yī)學(xué)中的重要研究領(lǐng)域,并對人類健康生活有重大影響。癌癥是一類細胞惡性增殖的疾病,因其病理十分復(fù)雜,人類尚無法攻克這類疾病。二代測序(next generation sequencing)為快速檢測病人遺傳信息提供了可能。然而測序需要從病人組織中提取樣本,但通常癌癥組織并不是只單純地包含癌癥細胞,它還有非常豐富的微環(huán)境。癌癥細胞微環(huán)境指包圍或伴隨癌癥細胞的正常細胞(non-cancerous cells)環(huán)境。癌細胞樣本提取時,這些微環(huán)境會和癌細胞一起被提取,并會伴隨癌細胞一起被測序[1]。癌癥細胞在癌癥樣本中的比例被定義為癌癥樣本的純度。癌癥基因組通常包含著大量體細胞序列拷貝數(shù)變異,這些變異主要由基因組片段擴增或刪除造成。識別特定腫瘤基因組的基因組片段拷貝數(shù)變化,是癌癥基因組研究的一個重要課題。要準(zhǔn)確鑒定基因組片段拷貝數(shù)具有一定挑戰(zhàn),因為癌癥片段拷貝數(shù)主要由兩個因素混合決定,一是癌癥樣本純度,即癌癥細胞在癌癥樣本中所占比例,二是染色體倍性[2,3]。傳統(tǒng)中鑒定癌癥樣本純度和染色體倍性的方法是使用實驗技術(shù),如定量圖像分析[4]或單細胞測序[5]。但是在大型項目中,這樣的方法會耗費大量人力、資金和時間。隨著測序技術(shù)地發(fā)展,測序數(shù)據(jù)地快速增長,以及測序數(shù)據(jù)分析技術(shù)的積累,各種各樣的癌癥樣本純度算法被提出,并開發(fā)出了相對應(yīng)的軟件。
基于基因組片段拷貝數(shù)變異和基于等位基因頻率(突變位點的B-等位基因(B-allele))的計算方法被相繼提出?;诘任换蝾l率的方法有PurityEst[6]和PurBayes[7],主要是依賴于隨著腫瘤樣本純度和腫瘤基因組倍性的不同,等位基因的頻率會有所不同?;诳截悢?shù)變異的方法有CNAnorm[8]、THetA[9]、和ABSOLUTE[10]等。然而這兩種方法都有不同程度的問題,使用等位基因頻率的方法由于數(shù)據(jù)量的問題會有較大的誤差,而運用拷貝數(shù)變異的方法雖然較穩(wěn)定,但卻無法區(qū)分樣本純度和染色體倍性的補償效應(yīng),即存在識別問題。以上基于片段拷貝數(shù)的軟件都沒有解決這一問題,CNAnorm傾向于選擇染色體倍性離二倍體最近的解決方案,ABSOLUTE結(jié)合了其他的經(jīng)驗數(shù)據(jù),THetA則直接將所有可能結(jié)果都列出來了。
更優(yōu)的方案應(yīng)該是結(jié)合等位基因頻率信息和片段拷貝數(shù)信息共同計算腫瘤樣本純度。PyLOH[11],patchwork[12]使用了基因組上雜合SNV(單核苷酸變異)位點的頻率信息,和基因組片段的拷貝數(shù)。PyLOH一定程度上解決了“識別困難”的問題,可以更合理給出唯一解決方案。但是其準(zhǔn)確性較差,特別是遇到基因組中存在亞克隆(subclone)的情況下。Patchwork同時使用了兩種信息,但是在計算基因型的中間步驟中,需要人工識別,人工判斷的結(jié)果缺乏準(zhǔn)確性,并且這種半自動化軟件給應(yīng)用帶來很多不便。
如何充分利用現(xiàn)有的二代測序數(shù)據(jù)準(zhǔn)確計算癌癥樣本純度和癌癥細胞基因組倍性問題仍然是一項具有挑戰(zhàn)性的工作。
參考文獻
1、Junttila M R,de Sauvage F J.Influence of tumour micro-environmentheterogeneity on therapeutic response[J].Nature,2013,501(7467):346-354.
2、Carter S L,Cibulskis K,Helman E,et al.Absolute quantification ofsomatic DNA alterations in human cancer[J].Nature Biotechnology,2012,30(5):413-21.
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院上海藥物研究所,未經(jīng)中國科學(xué)院上海藥物研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710312237.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





