[發明專利]用于分析核酸的系統和方法在審
| 申請號: | 201780010411.0 | 申請日: | 2017-02-09 |
| 公開(公告)號: | CN108885648A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | F·M·德拉維加 | 申請(專利權)人: | 托馬生物科學公司 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22;C40B60/10;H01L27/118;H01L21/768 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 王維綺 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 變體 體細胞 測序數據 概率建模 計算分析 軟件介質 序列變體 醫療保健 分析 試劑盒 核酸 突變 推斷 樣本 統計 網絡 | ||
本發明提供了用于對來自個體的樣本的測序數據進行計算分析的系統、軟件介質、網絡、試劑盒和方法。分析可以提取種系和體細胞信息并比較兩種類型的信息,以基于概率建模和統計推斷來識別序列變體。分析可以包括區分種系變體(例如,私有變體(private variant))和體細胞突變。識別的變體可供臨床使用以提供更好的醫療保健。
本申請要求申請日為2016年2月9日的美國專利申請序列號62/293,136的優先權,該專利申請在此以其全文形式被援引加入本文。
背景技術
從組織樣本的高通量測序數據中準確識別癌癥體細胞突變可能是具挑戰性的和未解的難題。測序數據可用于臨床過程,用于具有未知分析率的假陽性或陰性變體的治療選擇。在這個過程中可能面對的問題包括:鑒于根據樣本的大范圍不同比例的存在正常細胞的組織樣本的異質性(例如,原發腫瘤vs.血漿中的無細胞DNA(cf-DNA)),不同比例的多個癌細胞克隆的存在,來自“正常”組織的樣本的能夠區分體細胞和種系變體的數據的缺乏,由于病理學處理(例如,福爾馬林固定和石蠟包埋(FFPE))對樣本中的DNA造成的損害,以及結構變異與簡單序列變體的卷積。新的分析方法可以改進從大規模測序數據中識別種系變體。
在一些情況,當將分析中的數據與單個對照樣本進行比較時,癌癥數據分析可能產生不一致的結果。在一些情況,數據分析依賴于來自患者的正常組織的數據的可用性,所述數據以與含有或懷疑含有癌細胞的樣本相似的方式進行處理,其通常在癌癥病理學用例中不可用。目前包括人工或啟發式方法以從體細胞突變中過濾出種系變體的分析管道(analysis pipeline)可能是任意的、不精確的、難以再現的,并且不提供關于在該過程中默認作出的假陽性和假陰性之間的權衡的信息。不過,當正常組織可用時,在一些情況它被獨立分析,并且僅在對“真實”種系變體做出決定后作為過濾步驟被匯集在一起,這可能由于種系變體錯過了種系識別所施加的閾值而導致假陽性體細胞突變。處理后期問題的解決方案可以是使用正常樣本組作為群體中常見的參考種系變體。為了進一步處理患者中存在的罕見變體,包括癌癥易感性變體,本發明披露了新的方法。所述方法可以基于同時對從患者以及一組其他先前分析的患者中獲得的所有樣本的比對的測序數據中的變體進行識別和評分。
發明內容
本發明提供了用于從組織的高通量測序數據中識別癌癥體細胞突變的系統、軟件介質、網絡和方法。
在一個方面,本發明公開了一種計算系統,包括:(a)處理器,以及被設置成執行機器可讀指令的存儲器模塊;和(b)數據分析應用程序,所述數據分析應用程序包括:(1)數據接收模塊,所述數據接收模塊被設置成從個體的一個或多個樣本接收核酸分子的測序片段,其中測序片段由高通量測序儀產生;(2)序列比對模塊,所述序列比對模塊被設置成將測序片段相對于參考組裝進行比對以產生預測的基因組序列;和(3)基因組分析模塊,所述基因組分析模塊被設置成(i)通過聯合和同時分析預測的基因組序列來識別推定的變體,和(ii)通過為體細胞突變或種系變體的概率對推定的變體進行評分。
在另一方面,本發明公開了一種編碼有計算機程序的計算機可讀存儲介質,所述計算機程序包括通過處理器可執行的指令以創建數據分析應用程序,所述應用程序包括:(a)數據接收模塊,所述數據接收模塊被設置成從個體的一個或多個樣本接收核酸分子的測序片段,其中測序片段由高通量測序儀產生;(b)序列比對模塊,所述序列比對模塊被設置成將測序片段相對于參考組裝進行比對以產生預測的基因組序列;和(c)基因組分析模塊,所述基因組分析模塊被設置成(i)通過聯合和同時分析預測的基因組序列來識別推定的變體,和(ii)通過為體細胞突變或種系變體的概率對推定的變體進行評分。
在另一方面,公開了一種方法,包括:(a)采集個體的一個或多個樣本;(b)利用高通量測序儀對一個或多個樣本的核酸分子進行測序并產生測序片段;(c)將測序片段與參考組裝進行比對以產生預測的基因組序列;(d)通過聯合和同時分析預測的基因組序列來識別推定的變體;以及(e)通過為體細胞突變或種系變體的概率對推定的變體進行評分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于托馬生物科學公司,未經托馬生物科學公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780010411.0/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





