[發明專利]一種可以有效降低錯誤的UMI設計方法有效
| 申請號: | 202010043604.X | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN110853709B | 公開(公告)日: | 2020-06-19 |
| 發明(設計)人: | 段小紅;樊玉才;楊春燕;張騰龍;張碩;周啟明 | 申請(專利權)人: | 求臻醫學科技(北京)有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B20/50;C12Q1/6806 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100176 北京市大興區經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 可以 有效 降低 錯誤 umi 設計 方法 | ||
1.一種可以有效降低錯誤的UMI設計方法,其特征在于,包括如下步驟:
步驟S1、篩選132組UMI序列:7個核苷酸為一組UMI,每個位點在腺嘌呤脫氧核糖核苷酸、鳥嘌呤脫氧核糖核苷酸、胸腺嘧啶脫氧核糖核苷酸和胞嘧啶脫氧核糖核苷酸中任選一種脫氧核苷酸,雙端UMI的組合為268435456種;根據篩選原則,并為了增加UMI復雜度,排除2個以上相同堿基連續出現的序列,從單端16384組UMI中挑選出132組UMI;
步驟S2、UMI分子在NGS文庫分子中的結構位置設計:UMI分子采用標簽連接到目標序列兩端的策略,連接在P5端測序接頭或P7端測序接頭兩端的隨機UMI分子通過與目標序列兩端連接,減少了必須設計和合成的標簽數量,增加了UMI組合的整體隨機性,通過識別目標序列的UMI分子,正確區分真突變與假突變;
步驟S3、回復校正:通過對單個堿基發生錯誤的UMI分子信息進行生物信息比對,對UMI分子進行回復校正,并在分析前剔除無法校正的錯誤UMI分子,找出其正確的UMI序列,并進一步用于后續的測序分析;
所述步驟S1中所述篩選原則為:任意2個UMI之間的序列差異最小為3個,UMI中堿基出現G或者C的個數總和小于5個。
2.根據權利要求1所述的一種可以有效降低錯誤的UMI設計方法,其特征在于,所述錯誤包括UMI的序列經過PCR過程中發生的序列變化,以及DNA序列在測序過程中發生的序列變化。
3.根據權利要求1所述的一種可以有效降低錯誤的UMI設計方法,其特征在于,所述步驟S2中P5端測序接頭的結構包括測序引物P5,P5端UMI,P5端index;P7端測序接頭結構包括測序引物P7,P7端UMI,P7端index;與目標序列連接時,采用雙端UMI分子連接的策略;連接順序為P5端測序接頭,目標序列,P7端測序接頭。
4.根據權利要求1所述的一種可以有效降低錯誤的UMI設計方法,其特征在于,所述132組UMI,序列如下,
umi_1 ACACACA umi_36 ATAGCGT umi_71 CTACATA umi_106 GTCTCTA umi_2 ACACGAC umi_37 ATATCTC umi_72 CTACGAT umi_107 GTGCATG umi_3 ACACTGT umi_38 ATATGAG umi_73 CTACTGC umi_108 TACGAGC umi_4 ACAGAGC umi_39 ATCACGC umi_74 CTAGCAC umi_109 TACTCTC umi_5 ACAGCAG umi_40 ATCAGTA umi_75 CTAGTCT umi_110 TACTGCG umi_6 ACATATG umi_41 ATCATAT umi_76 CTATACG umi_111 TAGATCA umi_7 ACATCGA umi_42 ATCGAGA umi_77 CTCATCG umi_112 TAGCGAT umi_8 ACATGCT umi_43 ATCGCTG umi_78 CTCTCAG umi_113 TATACGC umi_9 ACGACAC umi_44 ATGCACT umi_79 CTCTGTC umi_114 TATAGTA umi_10 ACGAGCA umi_45 ATGCTGA umi_80 CTGACAT umi_115 TATCACG umi_11 ACGCATC umi_46 ATGTATA umi_81 CTGTGCT umi_116 TATCTGA umi_12 ACGCTAG umi_47 CACACAC umi_82 GACAGTC umi_117 TATGTAC umi_13 ACGTAGT umi_48 CACAGCA umi_83 GACGATG umi_118 TCAGTCA umi_14 ACTACGT umi_49 CACATGT umi_84 GACGTGA umi_119 TCATCAC umi_15 ACTAGAG umi_50 CACGACT umi_85 GACTCGT umi_120 TCGAGTC umi_16 ACTCGTA umi_51 CACGCTA umi_86 GAGAGCT umi_121 TCGCAGA umi_17 ACTGACG umi_52 CACGTAG umi_87 GAGATGC umi_122 TCGCTCT umi_18 ACTGCTC umi_53 CACTAGA umi_88 GAGCAGT umi_123 TCGTCTG umi_19 ACTGTAT umi_54 CACTGAT umi_89 GAGCGTA umi_124 TCTAGCT umi_20 AGACGTG umi_55 CAGACGA umi_90 GAGTACG umi_125 TCTGAGT umi_21 AGAGACT umi_56 CAGAGAG umi_91 GAGTCAC umi_126 TGACATC umi_22 AGAGCTA umi_57 CAGCACA umi_92 GATATAG umi_127 TGACGCT umi_23 AGAGTAC umi_58 CAGCTAC umi_93 GATCGAC umi_128 TGCACGT umi_24 AGATCAT umi_59 CAGTATC umi_94 GCAGATA umi_129 TGCAGTG umi_25 AGCACAG umi_60 CATACTG umi_95 GCATGTC umi_130 TGCGTAT umi_26 AGCAGCT umi_61 CATCAGC umi_96 GCGACTA umi_131 TGTGACA umi_27 AGCATGA umi_62 CATCGCT umi_97 GCGATAT umi_132 TGTGCAG umi_28 AGCGATC umi_63 CATGCAT umi_98 GCTATCA umi_29 AGCTACA umi_64 CATGTCA umi_99 GCTCACT umi_30 AGCTGAC umi_65 CGACAGT umi_100 GTACGCA umi_31 AGTAGTC umi_66 CGACTAG umi_101 GTAGTAG umi_32 AGTATCG umi_67 CGAGATG umi_102 GTATAGA umi_33 AGTCAGA umi_68 CGAGTGA umi_103 GTCAGAG umi_34 AGTCGAT umi_69 CGATGCA umi_104 GTCGCAT umi_35 ATACTCG umi_70 CGTATAC umi_105 GTCTACT
。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于求臻醫學科技(北京)有限公司,未經求臻醫學科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010043604.X/1.html,轉載請聲明來源鉆瓜專利網。





