[發明專利]一種基因組測序組裝結果修復的方法、裝置和存儲介質有效
| 申請號: | 201810219052.6 | 申請日: | 2018-03-16 |
| 公開(公告)號: | CN110310702B | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 賀麗娟;劉亞斌;楊林峰;鄧天全;陳露;高強 | 申請(專利權)人: | 深圳華大基因科技服務有限公司 |
| 主分類號: | G16B25/00 | 分類號: | G16B25/00;G16B30/10 |
| 代理公司: | 深圳鼎合誠知識產權代理有限公司 44281 | 代理人: | 李小焦;彭家恩 |
| 地址: | 518083 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因組 組裝 結果 修復 方法 裝置 存儲 介質 | ||
本申請公開了一種基因組測序組裝結果修復的方法、裝置和存儲介質。本申請的方法包括,將待驗證基因組組裝結果與Bionano分子圖譜比對,找出兩者分子標記不匹配或長度不一致的區域,在該區域的基因組序列上下游各延伸預設長度,作為異常區域;分別分析二代數據和三代數據對異常區域的覆蓋度;根據覆蓋度對異常區域進行修復,獲得修復的基因組組裝結果。本申請方法,采用二代測序技術、三代測序技術和Bionano圖譜聯合修復基因組組裝結果,解決了基因組拼接中由區域復雜性引入的結構性錯誤,可防止傳統Bionano驗證對結構沖突區域操作處理上對組裝結果的過多丟失,也可處理和驗證Bionano與基因組組裝結果分子標記長度不一致區域,提高了基因組拼接準確性和完整性。
技術領域
本申請涉及核酸測序領域,特別是涉及一種基因組測序組裝結果修復的方法、裝置和存儲介質。
背景技術
目前,基于全基因組鳥槍法(WGS)的Illumina測序平臺得到的二代測序數據具有測序通量高,速度快,精確度高,成本低,并且可以測量不同插入片段大小的DNA片段文庫,尤其可以測量DNA大片段文庫序列的特點,例如可以測量插入片段長度大于1k的文庫,在過去的幾年時間內廣泛應用在基因組組裝分析中。
但是二代測序方法由于測序片段短,采用雙末端測序方法,對于基因組內部具有很高復雜度的區域,測序數據很難正確處理。隨后擁有超長讀長的第三代單分子實時測序技術(SMRT)的Pacbio數據也飛速發展起來;同時,擁有超高精度和超長序列的新一代圖譜方法BioNano Genomics’ System測序得到的分子圖譜,簡稱Bionano分子圖譜,也越來越多的應用于基因組組裝的輔助分析中。
隨著技術的發展,現在基因組組裝的主要技術是用三代Pacbio數據搭建基因組骨架,然后用三代Pacbio數據和二代數據對基因組組裝結果進行糾錯,然后用Bionano分子圖譜進行scaffold連接,得到最終的組裝結果。Pacbio數據有高的測序錯誤,二代數據精確性高,但是序列長度偏短。所以二代Illumina數據及三代Pacbio數據結合使用得到較為完整的基因組骨架,同時用Bionano分子圖譜將基因組結果連成更為完整的基因組組裝結果,這種方法已經被逐漸應用于組裝案例中。
但是,在實際利用超長讀長的Bionano分子圖譜對基因組組裝結果進行結構驗證時,發現存在很多結構異常區域,對于這些結構異常區域的處理方法包括:
(1)用Bionano分子圖譜直接對組裝結果進行連接,對于有沖突的區域直接在分子標記處打斷,由于Bionano分子圖譜的分子標記之間的距離很大,這樣會導致一些實際上正常的序列也被截斷,進而導致本來正確的組裝序列的丟失。
(2)傳統的Bionano分子圖譜的直接處理方法,對于分子標記結構匹配但長度不一致的區域,都當作結構變異(縮寫SV)處理,在組裝結果中不做修正,但是在實際中,這樣的序列也可能是組裝序列不完整導致。
發明內容
本申請的目的是提供一種新的基因組測序組裝結果修復的方法、裝置和存儲介質。
本申請的第一方面公開了一種基因組測序組裝結果修復的方法,包括將待驗證的基因組組裝結果與Bionano分子圖譜進行比對,找出兩者的分子標記不匹配或者對應長度不一致的區域,在不匹配或者對應長度不一致的區域的基因組序列的上下游各延伸預設長度,作為異常區域;分別分析第二代測序數據和第三代測序數據對異常區域的覆蓋度;根據第二代測序數據和第三代測序數據對異常區域的覆蓋度,對異常區域進行修復,獲得修復的基因組組裝結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技服務有限公司,未經深圳華大基因科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810219052.6/2.html,轉載請聲明來源鉆瓜專利網。





