[發明專利]對染色體測序結果進行GC校正的方法及裝置有效
| 申請號: | 201410339920.6 | 申請日: | 2011-06-29 |
| 公開(公告)號: | CN104120181B | 公開(公告)日: | 2017-06-09 |
| 發明(設計)人: | 蔣馥蔓;陳會飛;柴相花;袁玉英;張秀清;陳芳 | 申請(專利權)人: | 深圳華大基因股份有限公司 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68;C12M1/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 李志東 |
| 地址: | 518083 廣東省深圳市鹽田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 染色體 結果 進行 gc 校正 方法 裝置 | ||
1.一種用于建立染色體的覆蓋深度和GC含量之間的關系的方法,所述方法包括:
從多于一個樣品獲得涵蓋所述染色體的多個多核苷酸片段的序列信息;
基于所述序列信息將所述片段分配至染色體;
基于每個樣品的所述序列信息計算所述染色體的覆蓋深度和GC含量;并且
確定所述染色體的所述覆蓋深度和GC含量之間的關系。
2.根據權利要求1所述的方法,其中所述分配是通過將所述片段的序列與人基因組參考序列比較進行的。
3.根據權利要求1所述的方法,其中所述染色體的所述覆蓋深度是分配至所述染色體的片段數目與所述染色體的參考獨特讀段數目之間的比值。
4.根據權利要求3所述的方法,其中所述覆蓋深度是標準化的。
5.根據權利要求4所述的方法,其中所述標準化是相對于另一染色體的所述覆蓋度進行計算的,或者相對于所有其他常染色體的所述覆蓋度進行計算的,或者相對于所有其他染色體的所述覆蓋度進行計算的。
6.根據權利要求1所述的方法,其中所述染色體的所述GC含量是分配至所述染色體的所有片段的平均GC含量。
7.根據權利要求1所述的方法,其中所述染色體是染色體1、2、……、22、X或Y。
8.根據權利要求4所述的方法,其中所述關系為以下公式:
cri,j=f(GCi,j)+εi,j,j=1,2,…,22,X,Y,
其中f(GCi,j)代表樣品i、染色體j的覆蓋深度和相應GC含量之間的關系的函數,εi,j代表樣品i、染色體j的殘差。
9.根據權利要求1所述的方法,其中所述覆蓋深度和GC含量之間的關系是通過局部多項式回歸計算的。
10.根據權利要求9所述的方法,其中所述關系是非強線性關系。
11.根據權利要求10所述的方法,其中所述關系通過loess算法確定。
12.根據權利要求8所述的方法,進一步包括:根據以下公式計算擬合覆蓋深度:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因股份有限公司,未經深圳華大基因股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410339920.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種適用于電子商務的智能存儲箱
- 下一篇:車輛上報信息的處理方法和裝置





