[發明專利]一種可以有效降低錯誤的UMI設計方法有效
| 申請號: | 202010043604.X | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN110853709B | 公開(公告)日: | 2020-06-19 |
| 發明(設計)人: | 段小紅;樊玉才;楊春燕;張騰龍;張碩;周啟明 | 申請(專利權)人: | 求臻醫學科技(北京)有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B20/50;C12Q1/6806 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100176 北京市大興區經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 可以 有效 降低 錯誤 umi 設計 方法 | ||
本發明公開了一種可以有效降低錯誤的UMI設計方法,其特征在于,包括如下步驟:步驟S1、篩選132組UMI序列;步驟S2、UMI分子在NGS文庫分子中的結構位置設計;步驟S3、回復校正。本發明公開的可以有效降低錯誤的UMI設計方法可以通過識別錯誤UMI的序列信息進行回復校正,提升UMI的錯誤識別效率,降低PCR或者測序過程中的錯誤,提高測序的準確率。
技術領域
本發明涉及基因測序技術領域,尤其涉及一種可以有效降低錯誤的UMI設計方法。
背景技術
下一代測序技術(Next Generation Sequencing, NGS)在分子腫瘤學領域有廣泛的應用,其中最常用的是基因組DNA變異分析和RNA表達分析。這些分析應用除了能對整個基因組和外顯子組進行檢測,還可專門測序特定的區域。
在NGS測序前,常用兩種方法富集目標區域:可以使用靶向特異性探針從文庫分子中雜交捕獲,也可利用目標區域特異性引物對文庫進行擴增。由于以上兩種常用的目標富集方法在文庫制備,靶向序列捕獲,以及測序過程中均涉及聚合酶鏈式反應(PolymeraseChain Reaction, PCR),且測序存在一定錯誤的概率,這些因素會導致高深度測序過程中放大假陽性的信號。在使用NGS檢測稀有突變時,檢測人員需要高深度的測序,因此能夠減少或避免系統誤差,正確區分低頻突變和測序產生的背景噪音顯得尤為重要。
唯一標識序列(UMI)是為每一個樣本的原始DNA分子上連接一段獨一無二的序列編碼。UMI通常為完全隨機的核苷酸序列,或簡并核苷酸序列。具有相同UMI測序讀出的序列是相同原始分子經PCR復制的產物。UMI可以追蹤重復產物,將PCR假陽性的突變位點與原始分子中真正的變異區分開來,通過在靶向捕獲檢測中添加傳統UMI分子,對標記后的單個DNA分子進行高深度測序,進一步提高單個分子單堿基的準確性。
在對測序數據分析時,通過UMI將帶有相同標記的分子聚集在一起進行統一分析。由于測序背景噪音在高深度測序數據中呈零散分布,統計一致性序列后即得到了校正后的精確序列。
因此,尋求一種可以有效降低錯誤的 UMI設計方法是業內研究者們亟待解決的難題。
發明內容
本發明的主要目的在于提供一種可以有效降低錯誤的 UMI設計方法,該方法可以通過識別錯誤UMI的序列信息進行回復校正,提升UMI的錯誤識別效率,降低PCR或者測序過程中的錯誤,提高測序的準確率。
為達到以上目的,本發明采用的技術方案為一種可以有效降低錯誤的 UMI設計方法,其特征在于,包括如下步驟。
步驟S1、篩選132組UMI序列:7個核苷酸為一組UMI,由于每個位點可選擇4種核苷酸(A/T/C/G)中的任意一種,雙端UMI的組合為268435456種。
步驟S2、UMI分子在NGS文庫分子中的結構位置設計:UMI分子采用標簽連接到目標序列兩端的策略,連接在P5端測序接頭或P7端測序接頭兩端的隨機UMI分子。
步驟S3、回復校正:通過對單個堿基發生錯誤的UMI分子信息進行生物信息比對,對UMI分子進行回復校正,并在分析前剔除無法校正的錯誤UMI分子,找出其正確的UMI序列,并進一步用于后續的測序分析;進一步地,使用FASTQ軟件對原始下機數據進行處理,去掉測序質量較低的數據,隨后使用UMI的生物信息學分析工具fgbio將質控過的數據依據UMI進行分類操作。
進一步地,所述步驟S1中UMI篩選原則為:首先列出所有長度為7的隨機序列;對所有產生的隨機序列中包含連續2個堿基和3個堿基序列進行篩選過濾;剩余隨機序列中去除GC含量超過5個的隨機序列;篩選得到的隨機序列選擇其中一條作為基準序列,例如“ACACACA”,與其他序列進行比對,保留差異性大于3個堿基的序列;選擇下一條篩選得到的隨機序列作為基準序列進行比對,直到所有序列均作為基準序列進行比對,最終篩選出132條序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于求臻醫學科技(北京)有限公司,未經求臻醫學科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010043604.X/2.html,轉載請聲明來源鉆瓜專利網。





