[發明專利]校正核酸序列讀數的重復區域中的堿基調用的方法、系統和計算機可讀媒體有效
| 申請號: | 201780069481.3 | 申請日: | 2017-11-09 |
| 公開(公告)號: | CN110088840B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | S·埃爾-蒂夫勞伊 | 申請(專利權)人: | 生命科技股份有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;C12Q1/68;C12Q1/6869 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陶家蓉;陳揚揚 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 校正 核酸 序列 讀數 重復 區域 中的 堿基 調用 方法 系統 計算機 可讀 媒體 | ||
1.一種核酸序列分析方法,其包含:
接收對應于標記區域的多個核酸序列讀數,其中所述序列讀數中的每一個包括左側翼的第一堿基序列、右側翼的第二堿基序列和位于所述左側翼的最右側堿基和所述右側翼的最左側堿基之間的堿基的重復區域,其中所述重復區域包括重復堿基序列的多個重復;
對于所述序列讀數中的每一個,將與所述重復區域相鄰的所述左側翼的所述第一堿基序列的至少一部分與參考左側翼進行比對并且將與所述重復區域相鄰的所述右側翼的所述第二堿基序列的至少一部分與參考右側翼進行比對,其中所述參考左側翼和所述參考右側翼接界對應于所述標記區域的參考核酸序列的參考重復區域,以形成與所述標記區域相關聯的一組重復區域序列以及相鄰左側翼序列和相鄰右側翼序列;
接收對應于所述一組重復區域序列的多個流空間信號測量值;
為所述多個流空間信號測量值的一組流空間信號測量值確定一個或多個最佳簇,其中所述確定一個或多個最佳簇進一步包含生成概率密度函數的混合模型,其中所述概率密度函數中的每一個與流空間信號測量值的一個簇和隸屬參數相關聯,和
相對于所述隸屬參數使給定流的所述一組流空間信號測量值的所述混合模型的概率最大化,以形成所述最佳簇;
其中所述最佳簇中的至少一個與均聚物長度相關聯,其中所述一組流空間信號測量值對應于給定流和所述重復區域序列中的位置;和
將所述重復區域序列中的所述位置處的堿基調用修改為與所述給定流的所述流空間信號測量值的所述最佳簇相關聯的所述均聚物長度,以產生校正的重復區域序列,從而校正插入錯誤或缺失錯誤。
2.根據權利要求1所述的方法,其進一步包含計算所述校正的重復區域序列的重復數目。
3.根據權利要求1所述的方法,其中所述概率密度函數包含高斯概率密度函數。
4.根據權利要求1所述的方法,其中使所述混合模型的概率最大化進一步包含將期望最大化應用于高斯混合模型。
5.根據權利要求2所述的方法,其進一步包含將變體調用程序應用于對應于所述校正的重復區域序列的所述左側翼的所述第一堿基序列和所述右側翼的所述第二堿基序列,以確定變體類型和變體位置。
6.根據權利要求5所述的方法,其進一步包含組合所述校正的重復區域序列的所述重復數目以及對應于所述校正的重復區域序列的所述左側翼和所述右側翼的所述變體類型和所述變體位置的結果。
7.一種用于核酸序列分析的系統,其包含被配置成執行包括以下步驟的處理器,所述步驟包括:
接收對應于標記區域的多個核酸序列讀數,其中所述序列讀數中的每一個包括左側翼的第一堿基序列、右側翼的第二堿基序列和位于所述左側翼的最右側堿基和所述右側翼的最左側堿基之間的堿基的重復區域,其中所述重復區域包括重復堿基序列的多個重復;
對于所述序列讀數中的每一個,將與所述重復區域相鄰的所述左側翼的所述第一堿基序列的至少一部分與參考左側翼進行比對并且將與所述重復區域相鄰的所述右側翼的所述第二堿基序列的至少一部分與參考右側翼進行比對,其中所述參考左側翼和所述參考右側翼接界對應于所述標記區域的參考核酸序列的參考重復區域,以形成與所述標記區域相關聯的一組重復區域序列以及相鄰左側翼序列和相鄰右側翼序列;
接收對應于所述一組重復區域序列的多個流空間信號測量值;
為所述多個流空間信號測量值的一組流空間信號測量值確定一個或多個最佳簇,其中所述確定一個或多個最佳簇進一步包含生成概率密度函數的混合模型,其中所述概率密度函數中的每一個與流空間信號測量值的一個簇和隸屬參數相關聯,和
相對于所述隸屬參數使給定流的所述一組流空間信號測量值的所述混合模型的概率最大化,以形成所述最佳簇;
其中所述最佳簇中的至少一個與均聚物長度相關聯,其中所述一組流空間信號測量值對應于給定流和所述重復區域序列中的位置;和
將所述重復區域序列中的所述位置處的堿基調用修改為與所述給定流的所述流空間信號測量值的所述最佳簇相關聯的所述均聚物長度,以產生校正的重復區域序列,從而校正插入錯誤或缺失錯誤。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于生命科技股份有限公司,未經生命科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780069481.3/1.html,轉載請聲明來源鉆瓜專利網。





