[發明專利]用于二倍體基因組組裝和單倍型序列重建的方法、軟件和系統有效
| 申請號: | 201680030485.6 | 申請日: | 2016-05-23 |
| 公開(公告)號: | CN107615283B | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | C·金;P·佩魯索;D·蘭克 | 申請(專利權)人: | 加利福尼亞太平洋生物科學股份有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B20/40;G16B30/20;C12P19/34 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陶家蓉;余穎 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 二倍體 基因組 組裝 單倍型 序列 重建 方法 軟件 系統 | ||
1.一種用于二倍體基因組組裝和單倍型序列重建的方法,所述方法由在處理器上執行的至少一個軟件部件執行,所述方法包括:
在二倍體基因樣本中,從包含兩個單倍型的讀段產生融合組裝圖,所述融合組裝圖包括多個融合單倍型重疊群,融合單倍型重疊群包括所鑒別的主要重疊群和相關重疊群,其中主要重疊群是不具有延伸讀段的統一群圖或字符串圖的長度的分支的單一路徑,其中相關重疊群具有與統一群圖或字符串圖中所鑒別的字符串束的泡狀物區域中的至少一部分主要重疊群平行的路徑;
使用已定相的讀段和所述已定相的讀段的感知到有單倍型的重疊來產生單倍型特異組裝圖;
將所述融合組裝圖和所述單倍型特異組裝圖合并來產生合并的組裝單倍型圖;
從所述合并的組裝單倍型圖去除交叉定相的連線以產生最終單倍型已分辨的組裝圖;以及
從所述最終單倍型已分辨的組裝圖重建單倍型特異重疊群,從而產生單倍型特異重疊群;
其中使用已定相的讀段和所述已定相的讀段的感知到有單倍型的重疊來產生所述單倍型特異組裝圖還包括:
針對多個融合單倍型重疊群中的每個融合單倍型重疊群:
鑒別從屬于每個融合單倍型的重疊群的原始讀段的子組;
對所述原始讀段的子組進行定相,以使用單核苷酸多態性SNP信息來將所述原始讀段的子組中的每個讀段分類為表示不同單倍型的組;以及
將各融合單倍型的重疊群分解為單倍型特異重疊群;
其中,對于多個融合單倍型的重疊群中各融合單倍型的重疊群,從多個讀段鑒別從屬于各融合單倍型的重疊群的原始讀段的子組還包括:
使用用于產生組裝的重疊數據來收集來源于各融合單倍型的重疊群的相同基因組區域的讀段子組;以及
按照區塊和相位對原始讀段子組進行定相。
2.如權利要求1所述的方法,其中對原始讀段的子組進行定相還包括:
通過局部比對過程來對原始讀段子組內與每個融合單倍型重疊群的主要重疊群相關聯的一個或多個讀段進行比對;
執行雜合SNP 調用過程,所述雜合SNP調用過程鑒別SNP;以及
執行定相hetSNP 過程,所述定相hetSNP過程對具有共享的SNP的讀段進行分組。
3.如權利要求1所述的方法,所述方法還包括:同時對一個或多個單核苷酸多態性和多個讀段進行分組以獲得有關哪些讀段從屬于相同相位中的相同區塊的信息,從而產生一組已定相的讀段,所述已定相的讀段用于重建僅因小變異而不同的單倍型。
4.如權利要求1所述的方法,其中對所述重疊群進行分解還包括:
對測序讀段進行比對以鑒別在序列之間具有相似性的區域,從而產生已比對序列;
對所述已比對序列進行誤差校正以產生經過誤差校正的讀段;
對所述經過誤差校正的讀段進行比對;以及
在重疊階段期間使用所述已定相的讀段來確保只有相同相位的所述已比對的經過誤差校正的讀段彼此重疊,從而產生每個單倍型的一組重疊讀段。
5.如權利要求4所述的方法,所述方法還包括使用每個單倍型的所述重疊讀段組來產生所述單倍型特異組裝圖。
6.如權利要求1所述的方法,其中所述合并的組裝單倍型圖包括連接來自相同單倍型的節點的連線,以及連接來自不同單倍型的節點的連線,所述連線是所述交叉定相的連線。
7.如權利要求1所述的方法,其中所述單倍型特異重疊群包括已連接的定相區塊。
8.如權利要求1所述的方法,其中產生融合組裝圖還包括:
接收從長度為至少.5 kb的序列讀段產生的字符串圖和統一群圖;
鑒別所述統一群圖中的字符串束;
從所述字符串束中的每一個確定主要重疊群;以及
確定相較于所述主要重疊群而言含有結構變異的相關重疊群。
9.如權利要求7所述的方法,所述方法還包括:
鑒別主要重疊群中的候選分支點;以及
使相應的主要重疊群在所述分支點處中斷。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于加利福尼亞太平洋生物科學股份有限公司,未經加利福尼亞太平洋生物科學股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680030485.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:產量數據校準方法
- 下一篇:用于提供個體化放射療法的系統和方法





