[發明專利]基于DNA甲基化水平確定樣本類型的系統、可讀介質及其應用在審
| 申請號: | 202011360665.5 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN114566220A | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 梁瀚;李南南;吳逵;趙鑫;李甫強;林從;羅甜 | 申請(專利權)人: | 深圳華大生命科學研究院 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B50/00 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 王衛彬;黃益澍 |
| 地址: | 518083 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 dna 甲基化 水平 確定 樣本 類型 系統 可讀 介質 及其 應用 | ||
1.一種基于DNA甲基化水平確定樣本類型的系統,其特征在于,其包括:數據分析模塊、特征提取模塊和打分分型模塊,其中:
所述數據分析模塊用于對參考基因組進行窗口劃分,基于待測樣本與屬于至少兩種已知樣本類型的各樣本的甲基化測序文庫的測序讀段,分別計算各樣本的窗口甲基化率,并根據獲得的窗口甲基化率對窗口進行編號排序,由此獲得各樣本的窗口序列;
所述特征提取模塊用于根據獲得的已知樣本類型的各樣本的窗口序列,篩選各樣本的同序子序列并過濾已知樣本類型之間共同的高頻同序子序列,得到各已知樣本類型的特征序列;
所述打分分型模塊用于對特征提取模塊中得到的特征序列進行權重賦值,將待測樣本的窗口序列對應各已知樣本類型的特征序列進行加權,得到待測樣本相對于已知樣本類型的得分,并由此判斷待測樣本所屬的樣本類型。
2.如權利要求1所述的系統,其特征在于,所述數據分析模塊中,
所述窗口劃分為:對參考基因組優選hg39或hg38進行窗口劃分,優選以啟動子區域為單位依次對參考基因組進行窗口劃分,其中每個窗口為包含固定數量例如5~500,優選為10~350,更優選為30~150,例如為50個甲基化位點的區域;
所述根據窗口的甲基化率對窗口進行編號排序是指:對窗口優選順次編號,并根據窗口的甲基化率按升序或降序對已編號的窗口進行排序;
所述窗口的甲基化率的計算公式為:窗口內任一甲基化位點堿基被甲基化的測序讀段數目/比對到窗口內任一甲基化位點的全部測序讀段數目×100%。
3.如權利要求1所述的系統,其特征在于,所述特征提取模塊中,所述高頻同序子序列是指:在同一樣本類型的樣本中以高于設定的比例閾值出現的同序子序列;所述的比例閾值為30~70%,優選為50%;
其中:所述同序子序列是指在兩個或兩個以上的窗口序列中,由順序相同的窗口的編號組成的序列;
所述的過濾是指除去在至少兩個不同樣本類型中均出現的高頻同序子序列。
4.如權利要求1所述的系統,其特征在于,所述打分分型模塊中,所述權重賦值包括:
(1)根據所述特征序列在所屬樣本類型的樣本中出現的樣本數P1及未出現的樣本數P2,以及在除所屬樣本類型以外的另一樣本類型的樣本中出現的樣本數P3及未出現的樣本數P4計算所述特征序列的Fisher精確檢驗的p值;
(2)通過轉換函數轉換(1)得到的p值,并作為相應特征序列的權重;所述的轉換函數包括-1*log、-1*ln或取倒數。
5.如權利要求4所述的系統,其特征在于,所述(1)中,還包括:丟棄p值大于檢驗閾值的特征序列;優選地,所述檢驗閾值包括0.05或0.01。
6.如權利要求1所述的系統,其特征在于,所述打分分型模塊中,判斷待測樣本所屬樣本類型包括:
1)對不同的已知樣本類型的樣本優選采用10折交叉驗證計算得到對應已知樣本類型的樣本的得分集合;
2)根據1)中的得分集合計算不同的已知樣本類型的95%置信區間;
當待測樣本的得分同時落入不同的已知樣本類型的95%置信區間時,則拒絕對待測樣本的類型作出判斷,否則進行3);
3)比較待測樣本的得分與1)中的得分集合的平均值或中位值的距離,當待測樣本的得分與第一種已知樣本類型的得分集合的平均值或中位值的距離小于與第二種已知樣本類型的得分集合的平均值或中位值的距離時,判斷待測樣本屬于第一種已知樣本類型;否則為第二種已知樣本類型。
7.如權利要求1所述的系統,其特征在于,所述系統還包括甲基化測序模塊,所述甲基化測序模塊可對樣本進行甲基化測序,獲得測序數據;所述測序數據包含若干測序讀段;
優選地,所述的甲基化測序模塊為二代測序平臺或單分子測序平臺,例如BGI-seq500;
較佳地,所述已知樣本類型包括互補類型,優選所述互補類型為健康類型和患病類型;
所述患病類型優選為腫瘤類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大生命科學研究院,未經深圳華大生命科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011360665.5/1.html,轉載請聲明來源鉆瓜專利網。





