[發明專利]一種提升測序平臺文庫拆分率的標簽序列混庫方法和裝置有效
| 申請號: | 201610962942.7 | 申請日: | 2016-10-28 |
| 公開(公告)號: | CN108018607B | 公開(公告)日: | 2021-04-27 |
| 發明(設計)人: | 劉舒;伍梓靖 | 申請(專利權)人: | 深圳華大基因股份有限公司 |
| 主分類號: | C40B20/04 | 分類號: | C40B20/04;C12Q1/6869 |
| 代理公司: | 深圳鼎合誠知識產權代理有限公司 44281 | 代理人: | 孫銀行;彭家恩 |
| 地址: | 518083 廣東省深圳市鹽田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提升 平臺 文庫 拆分 標簽 序列 方法 裝置 | ||
本發明公開了一種提升測序平臺文庫拆分率的標簽序列混庫方法和裝置。所述方法包括:將多個標簽序列中每個位置的A、C堿基替換為同一個符號,將G、T堿基替換為另一個符號,從而將每個標簽序列轉換成由兩種符號表示的序列;選取標簽序列轉換后兩兩標簽序列在大于2個位置有差異的序列進行混庫。本發明的方法對標簽序列的堿基作轉化處理,并且設定兩兩混庫的差異標準,根據設置的標簽序列混庫組合規則,確保標簽序列測序成功率達到100%,標簽序列的拆分率達到90%以上。
技術領域
本發明涉及測序技術領域,尤其涉及一種提升測序平臺文庫拆分率的標簽序列混庫方法和裝置。
背景技術
測序平臺,尤其是Illumina測序平臺要求測序同一個循環(cycle)的堿基較為平衡,即最好保證每個循環每個堿基含量在25%左右。如果達不到要求,由于A、C堿基共用紅激光,G、T堿基共用綠激光,至少也要保證每個循環要分別存在兩個激發光中的1個堿基以保障機器能正常聚焦和運行,否則會在相應的循環出現測序質量差或者讀N情況。
標簽序列(index),例如華大基因研發的不同標簽序列的編號對應的序列差異各異,按照現有的標簽序列兩兩混庫(pooling,或稱池化)方法,無法保證每個循環都至少能存在兩種激發光中各自對應的1個堿基。因而在實際標簽序列測序時,出現了標簽序列個別循環讀N,影響文庫拆分率或者整體標簽序列數據較差,直接導致數據無法拆分或者拆分率低。
發明內容
本發明針對現有標簽序列測序拆分率低的問題,提供一種提升測序平臺文庫拆分率的標簽序列混庫方法和裝置。
根據本發明的第一方面,本發明提供一種提升測序平臺文庫拆分率的標簽序列混庫方法,包括:
將多個標簽序列中每個位置的A、C堿基替換為同一個符號,將G、T堿基替換為另一個符號,從而將每個標簽序列轉換成由兩種符號表示的序列;
選取標簽序列轉換后兩兩標簽序列在大于2個位置有差異的序列進行混庫。
進一步地,將標簽序列中每個位置的A、C堿基替換為符號A,將G、T堿基替換為符號B。
進一步地,上述標簽序列的長度是4-10個堿基,優選6-8個堿基。
進一步地,選取二者轉換后在≥4個位置有差異的序列進行混庫。
進一步地,上述測序平臺是Illumina Hiseq/Miseq測序平臺。
根據本發明的第二方面,本發明提供一種提升測序平臺文庫拆分率的標簽序列混庫裝置,包括:
序列轉換單元,用于將多個標簽序列中每個位置的A、C堿基替換為同一個符號,將G、T堿基替換為另一個符號,從而將每個標簽序列轉換成由兩種符號表示的序列;
序列比對單元,用于選取標簽序列轉換后兩兩標簽序列在大于2個位置有差異的序列進行混庫。
進一步地,將標簽序列中每個位置的A、C堿基替換為符號A,將G、T堿基替換為符號B。
進一步地,上述標簽序列的長度是4-10個堿基,優選6-8個堿基。
進一步地,選取二者轉換后在≥4個位置有差異的序列進行混庫。
進一步地,上述測序平臺是Illumina Hiseq/Miseq測序平臺。
本發明的標簽序列混庫方法,對標簽序列的堿基作轉化處理,并且設定兩兩混庫的差異標準,根據設置的標簽序列混庫(index pooling)組合規則,確保標簽序列測序成功率達到100%,標簽序列的拆分率達到90%以上。
附圖說明
圖1為本發明一個實施方案的標簽序列混庫方法的流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因股份有限公司,未經深圳華大基因股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610962942.7/2.html,轉載請聲明來源鉆瓜專利網。





