[發明專利]對測序序列進行變異模擬的方法及其應用在審
| 申請號: | 201910202272.2 | 申請日: | 2019-03-18 |
| 公開(公告)號: | CN109920485A | 公開(公告)日: | 2019-06-21 |
| 發明(設計)人: | 謝張冬;荊瑞琳;杜洋;李大為;玄兆伶;王海良;王娟;肖飛 | 申請(專利權)人: | 浙江安諾優達生物科技有限公司;安諾優達基因科技(北京)有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 322000 浙江省金華市義*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征串 測序序列 堿基序列 堿基 變異類型 模擬區域 狀態標記 整合 還原 應用 測試 | ||
本發明公開了對測序序列進行變異模擬的方法及其應用,其中,對測序序列進行變異模擬的方法包括:獲取待模擬區域的堿基序列;將所述堿基序列進行變異狀態標記,以便得到標記后的特征串;選取待添加的變異;將所述待添加的變異整合至所述標記后的特征串上,以便得到添加變異后的特征串;以及將所述添加變異后的特征串進行堿基還原,以便得到變異模擬后的序列。該方法通過對堿基序列的變異狀態進行標記,設定堿基的變異類型,從而對各種變異進行模擬,變異模擬的方法簡單,生成速度快,并能根據需要設計特殊的變異組合用于測試,變異模擬后的序列的仿真程度高。
技術領域
本發明涉及基因測序領域,具體地,涉及對測序序列進行變異模擬的方法及其應用,更具體地,涉及一種對測序序列進行變異模擬的方法、一種模擬目標疾病患者測序文庫的方法、一種對測序序列進行變異模擬的裝置,以及一種電子設備。
背景技術
在基因測序領域,隨著技術的快速更新迭代,誕生了許多新的檢測方法和流程,它們大多還不夠完善,性能仍需清晰、準確的定位,從而,需要利用已知變異的仿真序列檢測不同變異檢測軟件或流程的特點及差異等。一般來說,測試(“benchmarking”)會檢測真實的測序下機數據,在檢出變異之后還需要后續相應的實驗驗證,這導致該方法費時費力且費錢。數據模擬的方法可以很好地避開這些缺點,既不需要真實的下機數據,也不需要后續繁瑣的實驗驗證步驟,雖然相對于檢測真實的測序下機數據具有迅速、高效且效費比高的優點,但仍存在算法復雜,生成變異時間長和變異添加種類有限等問題。
由此,現有的測序序列的變異模擬的方法有待改進。
發明內容
本發明旨在至少解決現有技術中存在的技術問題之一。為此,本發明的一個目的在于提出一種對測序序列進行變異模擬的方法,該方法模擬的變異種類多,速度快,可以根據需要設計特殊的變異組合進行測試。
需要說明的是,本發明是基于發明人的下列工作而完成的:
目前可用于全基因組變異模擬的軟件有很多,比如FUSIM、RSVSim(2013)、SInC、SMaSH、SCNVsim、VarSim、IntSIM、SVEngine等等。它們有的側重于模擬部分變異,比如FUSIM、RSVSim;有的會同時模擬出下機reads,比如SInC;有的則會進一步地模擬出腫瘤樣本的一些特征,比如SCNVsim;還有的能參考真實數據庫指定變異,比如Pysim-sv。但是還沒有一款可以直接用于捕獲測序下機數據模擬的報道。和全基因組測序相比,捕獲測序有很多優勢,比如成本低、檢測速度快,測序深度高等,因此廣泛地用于疾病,尤其是腫瘤的檢測。此外,在捕獲測序條件下,有些變異所導致的結果是重疊的。比如目標區域外到目標區域內的復制和移位最終表現出的都只是一段已知序列的插入。還有,模擬生成的fasta序列是否正確也需要對應的機制去確認,這些都是現有的全基因組變異模擬無法實現。
發明人針對捕獲測序下機數據的特點,設計了一種變異模擬的方法,該方法不僅適用于全基因組測序數據,而且適用于捕獲測序下機數據。在該方法中,一方面,變異模擬即可以位于全部基因中,也可以限制在捕獲測序的目標區域中,并且根據捕獲測序的特點對變異的種類及輸出等做了特別處理;另一方面,發明人通過對序列堿基的變異狀態進行標記,從而根據變異標記在堿基序列上整合指定變異,然后再生成隨機變異??偟膩碚f,變異的模擬可以針對全基因組,也可以針對捕獲測序的目標區域,并通過變異狀態標記,對各堿基的變異類型進行標記,根據變異標記在指定變異的基礎上模擬各種類型的變異以及目標疾病樣本的特征。
因而,根據本發明的第一方面,本發明提供了一種對測序序列進行變異模擬的方法。根據本發明的實施例,該方法包括:獲取待模擬區域的堿基序列;將所述堿基序列進行變異狀態標記,以便得到標記后的特征串;選取待添加的變異;將所述待添加的變異整合至所述標記后的特征串上,以便得到添加變異后的特征串;以及將所述添加變異后的特征串進行堿基還原,以便得到變異模擬后的序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江安諾優達生物科技有限公司;安諾優達基因科技(北京)有限公司,未經浙江安諾優達生物科技有限公司;安諾優達基因科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910202272.2/2.html,轉載請聲明來源鉆瓜專利網。





