[發明專利]用于靶向測序的模型在審
| 申請號: | 201880076840.2 | 申請日: | 2018-11-27 |
| 公開(公告)號: | CN111742059A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | A·W·布洛克爾;E·哈貝爾;O·C·維恩;劉勤文 | 申請(專利權)人: | 格瑞爾公司 |
| 主分類號: | C12Q1/6869 | 分類號: | C12Q1/6869;G06F17/10 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 姚杰 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 靶向 模型 | ||
1.一種方法,包括:
生成無細胞核酸樣本的多個候選變體;
確定所述無細胞核酸樣本和對應基因組核酸樣本中所述候選變體中的每個候選變體的真實替代頻率的似然;
至少通過使用真實替代頻率的所述似然的模型來過濾所述候選變體;以及
輸出所過濾的所述候選變體。
2.根據權利要求1所述的方法,還包括:
通過為所述候選變體中的每個候選變體確定邊緣變體概率來過濾所述候選變體,所述邊緣變體概率指示所述候選變體是邊緣變體的概率。
3.根據權利要求2所述的方法,其中過濾所述候選變體包括:
接收位于序列讀取上的替代等位基因,所述序列讀取從基因組中的多個位置獲得;
基于所接收的所述替代等位基因來確定所述無細胞核酸樣本的邊緣變體的預測比率;
針對所述多個位置的子集中的每個位置:
從序列讀取中提取特征,所述序列讀取是從所述位置獲得的;
將所提取的所述特征作為輸入應用于訓練模型,以獲得針對所述位置的偽影得分和針對所述位置的非偽影得分,所述偽影得分反映了位于從所述位置獲得的序列讀取上的替代等位基因是處理偽影的結果的似然,所述非偽影得分反映了位于從所述位置獲得的序列讀取上的替代等位基因不是處理偽影的結果的似然;
通過組合針對所述位置的所述偽影得分、針對所述位置的所述非偽影得分以及針對所述無細胞核酸樣本的偽影的所述預測比率,來生成針對所述位置的所述邊緣變體概率;以及
基于所述邊緣變體概率將在所述位置處的所述候選變體中的一個候選變體報告為邊緣變體。
4.權利要求3的方法,其中所述無細胞核酸樣本的所述邊緣變體是由于所述序列讀取中的一個或多個序列讀取的部分的自發脫氨基作用。
5.根據權利要求3所述的方法,其中確定所述無細胞核酸樣本的邊緣變體的所述預測比率包括:
結合所接收的所述替代等位基因執行基于似然的估計,以生成估計器;以及
基于所述最大似然估計器來選擇邊緣變體的所述預測比率。
6.根據權利要求5所述的方法,其中所述基于似然的估計還結合從被分類為偽影類別的序列讀取所生成的第一分布而被執行。
7.根據權利要求5或6所述的方法,其中所述基于似然的估計還結合從被分類為非偽影類別的序列讀取所生成的第二分布而被執行。
8.根據權利要求3至7中任一項所述的方法,其中從所述位置的所述序列讀取提取的所述特征中的一個特征是測序讀取的子集上的替代等位基因的位置與所述測序讀取的所述子集的邊緣之間的中值距離。
9.根據權利要求3至8中任一項所述的方法,其中從所述位置的所述序列讀取中提取的所述特征中的一個特征是表示以下各項之間的差異的顯著性得分:
1)在所述測序讀取的第一子集上的替代等位基因的位置與所述第一子集中的所述測序讀取的邊緣之間的第一中值距離,以及
2)在所述測序讀取的第二子集上的參考等位基因的位置與所述第二子集中的所述測序讀取的邊緣之間的第二中值距離。
10.根據權利要求3至9中任一項所述的方法,其中從所述位置的所述序列讀取中提取的所述特征中的一個特征是等位基因分段,所述等位基因分段表示包含跨位置的所述替代等位基因的序列讀取的分段。
11.根據權利要求3至10中任一項所述的方法,其中基于所述邊緣變體概率將調用的所述變體報告為所述邊緣變體包括:
將所述邊緣變體概率與閾值進行比較;以及
基于所述比較將調用的所述變體報告為所述邊緣變體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于格瑞爾公司,未經格瑞爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880076840.2/1.html,轉載請聲明來源鉆瓜專利網。





