[發明專利]一種基因組測序設備及其片段連接支架的構建方法和系統有效
| 申請號: | 200810218342.5 | 申請日: | 2008-12-12 |
| 公開(公告)號: | CN101504697A | 公開(公告)日: | 2009-08-12 |
| 發明(設計)人: | 朱紅梅;單杲;倪培相;阮玨;王明偉;李瑞強;方曉東;王俊;楊煥明;汪建 | 申請(專利權)人: | 深圳華大基因研究院 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;C12Q1/68 |
| 代理公司: | 深圳中一專利商標事務所 | 代理人: | 張全文 |
| 地址: | 518083廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因組 設備 及其 片段 連接 支架 構建 方法 系統 | ||
1.一種片段連接支架構建方法,其特征在于,所述方法包括下述步驟:
將測序得到的正反向信息映射到片段連接群上;
根據映射到片段連接群上的多對正反向信息計算各片段連接群之間的空位大小平均長度,作為各片段連接群之間的空位大小;
根據計算得到的片段連接群之間的空位大小和片段連接群之間的正反向關系構建片段連接支架,得到完整的片段連接支架圖。
2.如權利要求1所述的方法,其特征在于,所述方法還包括下述步驟:
檢測所述片段連接支架圖中的重復片段連接群,并屏蔽檢測到的重復片段連接群。
3.如權利要求2所述的方法,其特征在于,所述重復片段連接群為在同一方向上連接到多個有交疊的片段連接群的片段連接群。
4.如權利要求1所述的方法,其特征在于,所述方法還包括下述步驟:
根據所述片段連接支架圖中各片段連接群之間的空位大小以及各片段連接群之間的正反向關系線性化所述片段連接支架圖。
5.如權利要求4所述的方法,其特征在于,所述方法還包括下述步驟:
重新計算線性化后片段連接支架圖中各片段連接群之間的空位大小。
6.如權利要求2或3所述的方法,其特征在于,所述方法還包括下述步驟:
當被屏蔽的重復片段連接群位于兩個唯一片段連接群之間時,恢復被屏蔽的重復片段連接群。
7.一種片段連接支架構建系統,其特征在于,所述系統包括:
正反向映射單元,用于將測序得到的正反向信息映射到片段連接群上;
空位大小計算單元,用于根據映射到片段連接群上的多對正反向信息計算各片段連接群之間的空位大小平均長度,作為各片段連接群之間的空位大小;
Scaffold構建單元,用于根據計算得到的片段連接群之間的空位大小和片段連接群之間的正反向關系構建片段連接支架,得到完整的片段連接支架圖。
8.如權利要求7所述的系統,其特征在于,所述系統還包括:
重復片段屏蔽單元,用于檢測所述片段連接支架圖中的重復片段連接群,并屏蔽檢測到的重復片段連接群。
9.如權利要求8所述的系統,其特征在于,所述系統還包括:
線性化單元,用于根據所述片段連接支架圖中各片段連接群之間的空位大小以及各片段連接群之間的正反向關系線性化所述片段連接支架圖。
10.如權利要求9所述的系統,其特征在于,所述空位大小計算單元還用于重新計算線性化后的片段連接支架圖中各片段連接群之間的空位大小。
11.如權利要求8所述的系統,其特征在于,所述系統還包括:
重復片段恢復單元,用于在被屏蔽的重復片段連接群位于兩個唯一片段連接群之間時,恢復被屏蔽的重復片段連接群。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因研究院,未經深圳華大基因研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810218342.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





