[發(fā)明專利]基于二代測序數據檢測目標基因結構變異的方法有效
| 申請?zhí)枺?/td> | 201711320249.0 | 申請日: | 2017-12-12 |
| 公開(公告)號: | CN108073791B | 公開(公告)日: | 2019-02-05 |
| 發(fā)明(設計)人: | 郎繼東;田埂 | 申請(專利權)人: | 元碼基因科技(蘇州)有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10 |
| 代理公司: | 北京科石知識產權代理有限公司 11595 | 代理人: | 高元吉 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 測序數據 檢測 結構變異 目標基因 測序 比對算法 參數設置 分析檢測 基因結構 靈敏度 數據量 比對 單端 檢出 | ||
本發(fā)明公開基于二代測序數據檢測目標基因結構變異的方法。本發(fā)明的方法直接從原始測序數據出發(fā),通過快速簡單的比對可進行基因結構變異的檢測,省去了復雜比對算法的參數設置,不僅檢測時間上有很明顯的提升,并且只需要單端測序亦可完成分析檢測,降低了數據量,從而進一步減少了測序成本,在檢出結果上也有了更高的靈敏度和特異性。
技術領域
本發(fā)明通常涉及基因檢測領域,特別地涉及基于二代測序數據檢測目標基因結構變異的方法。
背景技術
隨著測序成本越來越低,運用二代測序技術預測基因組DNA水平結構變異(SVs:Structure variations)的方法和技術越來越多,目前基于二代測序數據檢測結構變異的方法主要有四種:
第一種是依靠測序覆蓋深度的方法(Read depth)。對于單樣本,其為通過檢測該樣本在一個參考基因組上的短序列(reads)的深度分布情況來檢測;對于配對樣本(Case-Control),則是通過和識別出比較兩個樣本中所存在的丟失和重復倍增區(qū),其缺點是受實驗環(huán)節(jié)的擴增偏向性和測序偏向性影響較大,結果往往不是很準確。
第二種是配對雙末端測序方法(Paired-end sequencing)。這種方法可以檢測到大片段的插入、缺失、倒位、易位等結構變異,但受限于測序的插入片段長度的標準差(測序的拆入片段指的是測序之前在構建DNA測序文庫階段所打斷的DNA片段長度),且絕大多數方法過分依賴于比對算法,參數設置對結果的影響非常大。
第三種是序列讀長分割的方法(Split reads)。這種方法可以通過比對上的Soft-clip reads來精確的發(fā)現結構變異的斷點位置,但除了基因組上的重復序列對結果影響較大以外,同樣的也過分的依賴于比對算法及其參數的設置。
第四種是組裝的方法(Denovo assembly)。這種方法雖然可以更直接的檢測結構變異,但基于二代測序的短序列的組裝由于受到基因組上重復區(qū)域的影響仍然比較困難,且在成本上也會大大增加。
綜上所述,基于二代測序技術預測基因組DNA水平結構變異的方法仍需更高的速度和更高的靈敏度和特異性。
發(fā)明內容
為了解決現有技術中的至少部分技術問題,本發(fā)明提供基于二代測序數據檢測目標基因結構變異的方法。通過本發(fā)明的方法可以簡單快速的進行基因結構變異的分析,并且分析結果可靠、靈敏度高,特異性強。具體地,本發(fā)明包括以下內容。
本發(fā)明的第一方面,提供一種基于二代測序數據檢測目標基因結構變異的方法,其包括以下步驟:
(1)在由多個原始測序序列組成的集合中,針對各原始測序序列從5’端和3’端分別截取掉m個堿基,然后取截取后序列的5’端和3’端各n個堿基,構成待比對序列A和待比對序列B,其中m為0-20之間的整數,n為27-50之間的整數;
(2)由多個候選目標基因的序列組成第一參考序列庫,將全基因組序列作為第二參考序列庫,其中所述第一參考序列庫中各序列長度之和小于所述第二參考序列庫的序列長度之和;
(3)將所述待比對序列A和B分別與所述第一參考序列庫中的序列進行第一比對,
如果待比對序列A和B分別與第一參考序列庫中不同目標基因的序列完全匹配,則將所述待比對序列A和B作為第一比對序列對,
如果待比對序列A和B與第一參考序列庫中的序列不能完全匹配,或者待比對序列A和B均與第一參考序列庫中同一基因中的序列完全匹配,則終止比對,并去除待比對序列A和B;
(4)將所述第一比對序列對與所述第二參考序列庫中的序列進行第二比對,
如果所述第一比對序列對中各序列分別與第二參考序列庫中的序列完全匹配,并且能夠完全匹配的序列對為唯一比對序列對,則將所述第一比對序列對作為第二比對序列對,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于元碼基因科技(蘇州)有限公司,未經元碼基因科技(蘇州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711320249.0/2.html,轉載請聲明來源鉆瓜專利網。





