[發明專利]確定個體染色體結構異常的方法和系統在審
| 申請號: | 201710602834.3 | 申請日: | 2017-07-21 |
| 公開(公告)號: | CN109280702A | 公開(公告)日: | 2019-01-29 |
| 發明(設計)人: | 徐鳳萍;王文婧;葉玲飛;楊振軍;袁劍穎;徐金金 | 申請(專利權)人: | 深圳華大基因研究院 |
| 主分類號: | C12Q1/6883 | 分類號: | C12Q1/6883 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 趙天月 |
| 地址: | 518083 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 異常類型 染色體 集合 染色體結構 測序 全基因組 微陣列芯片 第一數據 數據分析 組織樣本 分析 樣本 | ||
1.一種確定個體染色體結構異常的方法,其特征在于,包括:
(1)利用核型分析和微陣列芯片分析的至少之一,確定所述個體的第一候選染色體結構異常類型,以便獲得第一候選染色體異常類型集合,所述第一候選染色體異常類型集合作為金標準結果集合;
(2)對所述個體的組織樣本進行全基因組測序,并對所得到的測序結果進行第一數據分析,以便獲得第二候選染色體異常類型集合,優選地,所述組織樣本為血液樣本;
(3)對所述個體的單細胞樣本進行全基因組測序,并對所得到的測序結果進行第二數據分析,以便獲得第三候選染色體異常類型集合,優選地,所述細胞樣本為淋巴細胞樣本;
(4)基于所述第一候選染色體異常類型集合、第二候選染色體異常類型集合和第三候選染色體異常類型集合,確定所述個體的最終染色體結構異常類型。
2.根據權利要求1所述的方法,其特征在于,所述染色體結構異常包括結構變異SV和拷貝數變異CNV的至少之一。
3.根據權利要求1所述的方法,其特征在于,所述第一數據分析和所述第二數據分析的至少之一是通過下列步驟進行的:
(a)將所述測序結果與基因組參考序列比對,所述測序結果由多對讀長對構成;
(b)基于步驟(a)的比對結果,確定所述多對讀長對的每一對在所述基因組參考序列上的物理距離;
(c)基于步驟(b)中獲得的所述物理距離,將所述多對讀長對區分為正常匹配集合和異常匹配集合;
(d)將所述異常匹配集合中的讀長進行聚類,以便獲得多對讀長簇對;
(e)基于各讀長簇對中所含有讀長的緊致程度和線性相關性,對所述多對讀長簇對進行過濾;以及
(f)基于所述的經過過濾的多對讀長簇對,確定染色體結構異常的斷點和染色體異常類型。
4.根據權利要求3所述的方法,其特征在于,在步驟(c)中,通過將所述物理距離與預定的核酸片段長度相比較,將所述多對讀長對區分為正常匹配集合和異常匹配集合,其中,所述預定的核酸長度是基于所述全基因組測序的插入片段大小而確定的。
5.根據權利要求3所述的方法,其特征在于,所述緊致程度是基于下列公式確定的:
其中,x1,x2,x3…xn表示讀長簇的reads的位置,n表示讀長條數,M表示位置的平均值,s2表示方差。
6.根據權利要求5所述的方法,其特征在于,在計算所述緊致程度之前,預先將所述讀長簇對中位于所述讀長簇對長度范圍兩端25%以內的所述讀長的至少一部分排除。
7.根據權利要求3所述的方法,其特征在于,所述線性相關性是通過對所述讀長簇對所包含的讀長進行t-test相關性檢驗而確定的。
8.根據權利要求3所述的方法,其特征在于,在步驟(e)中進一步包括:
(e-1)基于所述讀長簇對中所含有的讀長與所述基因組參考序列的匹配關系,確定所述結構變異的類型;
(e-2)基于所述讀長簇對中所含有的讀長在所述基因組參考序列上的匹配位置,確定所述結構變異的斷點范圍。
9.根據權利要求8所述的方法,其特征在于,在步驟(e-2)中,
針對重復變異,選擇在所述成對讀長簇對中匹配到的距離最遠的兩個位置之間的范圍并向外側延伸預定距離,作為所述斷點范圍。
10.根據權利要求8所述的方法,其特征在于,在步驟(e-2)中,
針對缺失變異,選擇在所述成對讀長簇對中匹配到的距離最近的兩個位置之間的范圍并向內側延伸預定距離,作為所述斷點范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因研究院,未經深圳華大基因研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710602834.3/1.html,轉載請聲明來源鉆瓜專利網。





