[發(fā)明專利]一種識別DNA大片段缺失的方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810114734.0 | 申請日: | 2018-02-06 |
| 公開(公告)號: | CN108220404B | 公開(公告)日: | 2018-11-09 |
| 發(fā)明(設(shè)計)人: | 糜慶豐;郭懌盈;劉宇彬;鐘婉平;向書芹;吳春求;黃銓飛;劉麗菲 | 申請(專利權(quán))人: | 東莞博奧木華基因科技有限公司 |
| 主分類號: | C12Q1/6858 | 分類號: | C12Q1/6858;C12M1/34 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 523808 廣東省東莞市松山湖高新技*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 大片段缺失 測序 目標(biāo)缺失 片段區(qū)域 同一染色體 待測樣本 檢測結(jié)果 檢測區(qū)域 缺失類型 全基因 檢測 檢出 加權(quán) 內(nèi)參 參考 分析 | ||
1.一種識別DNA大片段缺失的方法,所述方法用于非疾病診斷目的,包括步驟:
S1:在目標(biāo)缺失片段區(qū)域內(nèi)設(shè)定至少3個檢測區(qū)域,其中2個檢測區(qū)域分別位于目標(biāo)缺失片段兩端,在目標(biāo)缺失片段區(qū)域外同一染色體上設(shè)置內(nèi)參區(qū)域,內(nèi)參區(qū)域個數(shù)≤檢測區(qū)域個數(shù);
S2:根據(jù)二代測序法獲得的檢測區(qū)域測序深度和內(nèi)參區(qū)域測序深度,在參考集中找出與待測樣本相似性高的若干個已知樣本構(gòu)成相似集,其中,所述參考集由已知樣本構(gòu)成;
S3:在相似集中,根據(jù)已知樣本與待測樣本的相似性,加權(quán)分析各缺失類型的已知樣本支持度,支持度最高且超過閾值的缺失類型為待測樣本的缺失類型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟S2進(jìn)一步包括:根據(jù)二代測序法獲得的檢測區(qū)域測序深度和內(nèi)參區(qū)域測序深度,計算樣本的特征值,所述特征值為同一樣本的檢測區(qū)域測序深度與內(nèi)參區(qū)域測序深度的比值,根據(jù)樣本的特征值,在參考集中找出與待測樣本相似性高的若干個已知樣本構(gòu)成相似集。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟S2中,“在參考集中找出與待測樣本相似性高的若干個已知樣本構(gòu)成相似集”具體包括:計算待測樣本與參考集中所有已知樣本之間的度量相似性的距離,選取與待測樣本相似性高的前X個已知樣本構(gòu)成相似集,X是不大于20的整數(shù)且不大于已知樣本總量的10%。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于:“度量相似性的距離”選自馬氏距離、明氏距離、曼哈頓距離、切比雪夫距離、蘭氏距離、歐氏距離。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于:計算待測樣本與參考集中所有已知樣本之間的歐式距離,采用下述公式:
Dij=
其中,i表示待測樣本編號,j表示已知樣本編號,Dij表示待測樣本i與已知樣本j的歐式距離;FjM表示已知樣本j第M個特征值,F(xiàn)iM表示待測樣本i第M個特征值,所述特征值為同一樣本的檢測區(qū)域測序深度與內(nèi)參區(qū)域測序深度的比值。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟S3具體包括:在相似集中,對已知樣本按與待測樣本的相似性從高到低賦以從大到小的權(quán)重;統(tǒng)計各缺失類型的已知樣本權(quán)重總和,作為各缺失類型的已知樣本支持度;以權(quán)重總和最高且超過閾值的缺失類型為待測樣本的缺失類型。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于:加權(quán)分析的權(quán)重賦值方式選自等差數(shù)列、等比數(shù)列,主成分分析。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于:參考集中至少30個已知樣本,若已知樣本個數(shù)≥150時,由已知樣本直接組成參考集,否則,利用已知樣本進(jìn)行交叉驗(yàn)證獲得最優(yōu)訓(xùn)練集作為參考集。
9.一種識別DNA大片段缺失的系統(tǒng),包括:
設(shè)計模塊:用于在目標(biāo)缺失片段區(qū)域內(nèi)設(shè)定至少3個檢測區(qū)域,其中2個檢測區(qū)域分別位于目標(biāo)缺失片段兩端,在目標(biāo)缺失片段區(qū)域外同一染色體上設(shè)置內(nèi)參區(qū)域,內(nèi)參區(qū)域個數(shù)≤檢測區(qū)域個數(shù);
分析模塊:用于根據(jù)二代測序法獲得的檢測區(qū)域測序深度和內(nèi)參區(qū)域測序深度,在參考集中找出與待測樣本相似性高的若干個已知樣本構(gòu)成相似集,其中,所述參考集由已知樣本構(gòu)成;
加權(quán)模塊:用于在相似集中,根據(jù)已知樣本與待測樣本的相似性,加權(quán)分析各缺失類型的已知樣本支持度,支持度最高且超過閾值的缺失類型為待測樣本的缺失類型。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于:所述系統(tǒng)還包括:測序模塊,設(shè)于分析模塊前,用于對樣本進(jìn)行建庫和二代測序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東莞博奧木華基因科技有限公司,未經(jīng)東莞博奧木華基因科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810114734.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種識別和定位線性陣列圖案中缺失元素的方法
- 一種缺失值的確定方法、裝置及電子設(shè)備
- 目標(biāo)檢測算法的評估方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 對測試樣本中的缺失屬性值進(jìn)行預(yù)測的方法及裝置
- 一種工程測試缺失數(shù)據(jù)的統(tǒng)計重建方法及系統(tǒng)
- 視頻人物的去除方法、裝置及設(shè)備及計算機(jī)可讀存儲介質(zhì)
- 圖像修復(fù)方法、裝置及電子設(shè)備
- 統(tǒng)計數(shù)據(jù)的補(bǔ)錄方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種差錯電量追補(bǔ)方法及終端
- 價值預(yù)測模型輸入數(shù)據(jù)生成方法、裝置、設(shè)備和介質(zhì)





