[發明專利]用于確定拷貝數變異的系統和方法有效
| 申請號: | 201480023468.0 | 申請日: | 2014-03-05 |
| 公開(公告)號: | CN105359151B | 公開(公告)日: | 2019-04-05 |
| 發明(設計)人: | K·康維卡;J·維奇 | 申請(專利權)人: | 生命科技股份有限公司 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 姬利永 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 確定 拷貝 變異 系統 方法 | ||
1.一種鑒別拷貝數變異的方法,其包含:
將讀數映射到參考序列;
對于參考序列的多個不重疊目標區域中的每一個計算覆蓋度,其中每個目標區域的覆蓋度是使用映射到該目標區域的讀數數目和其重疊中的堿基數目確定的,其中目標區域在多個多重PCR反應中擴增,在第一PCR反應器中擴增的第一組目標區域被分配到第一組圖像塊,且在第二PCR反應器中擴增的第二組目標區域被分配到第二組圖像塊,其中計算覆蓋度包括分開地確定第一組圖像塊的覆蓋度以及第二組圖像塊的覆蓋度;
使用代表覆蓋度分布的值對于每個目標區域正規化所述覆蓋度,其中代表覆蓋度分布的所述值是跨越具有假定單一倍性狀態的參考序列部分的覆蓋度分布的眾數、平均值或中值;
確定每個目標區域的評分函數,其中所述評分函數確定一組探索倍性狀態中的每一個倍性狀態的評分;
跨越所述目標區域和貫通所述一組探索倍性狀態確定最大評分路徑;以及
基于所述最大評分路徑提供拷貝數確定值。
2.根據權利要求1所述的方法,其中代表覆蓋度分布的所述值關于GC偏移校正。
3.根據權利要求1所述的方法,其中每個目標區域的評分函數是基于所述正規化覆蓋度與調整到探索倍性狀態的按比例縮放基線覆蓋度之間的差異。
4.根據權利要求1所述的方法,其中所述評分函數為針對所述一組探索倍性狀態中的每一個倍性狀態確定似然性的似然函數。
5.根據權利要求4所述的方法,其中所述似然函數使用方程式L=N(S-C,0,Sd)確定,其中S為所述目標區域的所述正規化樣品覆蓋度,C為所述目標區域的按比例縮放基線覆蓋度,且Sd為所述覆蓋度差異的標準差。
6.根據權利要求1所述的方法,其進一步包含確定所述最大評分路徑與預期倍性狀態的評分比率。
7.根據權利要求1所述的方法,其進一步包含確定所述最大評分路徑與最可能相鄰狀態的評分比率。
8.根據權利要求1所述的方法,其中所述最大評分路徑使用動態編程算法確定。
9.一種鑒別拷貝數變異讀數的方法,其包含:
對樣品進行多重擴增來產生一組樣品擴增子;
對匹配對照物進行多重擴增來產生一組對照擴增子;
將具有第一條碼序列的銜接子接合到所述樣品擴增子以創建樣品庫;
將具有第二條碼序列的銜接子接合到所述對照擴增子以創建對照庫;
實質上同時對所述樣品和對照庫測序以避免運行內測序變異來產生多個讀數;
基于所述第一或第二條碼序列的存在將讀數鑒別為樣品讀數或對照讀數;
將所述樣品讀數和對照讀數映射到參考基因組;
基于映射到多個目標區域的所述樣品讀數對于所述目標區域計算樣品覆蓋度;
基于映射到所述目標區域的所述對照讀數對于所述目標區域計算基線覆蓋度;
基于跨越所述多個目標區域的樣品覆蓋眾數或對照覆蓋眾數對于目標區域正規化所述樣品覆蓋度和基線覆蓋度;
基于所述目標區域的所述正規化樣品覆蓋度和所述基線覆蓋度確定每個目標區域的評分函數,其中所述評分函數確定一組探索倍性狀態中的每一個倍性狀態的評分;
跨越所述目標區域和貫通所述一組探索倍性狀態確定最大評分路徑;以及
基于所述最大評分路徑提供拷貝數確定值。
10.根據權利要求9所述的方法,其中所述樣品覆蓋眾數和所述對照覆蓋眾數關于GC偏移校正。
11.根據權利要求9所述的方法,其中每個目標區域的評分函數是基于所述正規化覆蓋度與調整到探索倍性狀態的按比例縮放基線覆蓋度之間的差異。
12.根據權利要求9所述的方法,其中所述評分函數為針對所述一組探索倍性狀態中的每一個倍性狀態確定似然性的似然函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于生命科技股份有限公司,未經生命科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480023468.0/1.html,轉載請聲明來源鉆瓜專利網。





