[發(fā)明專利]病毒整合位點捕獲測序分析方法有效
| 申請?zhí)枺?/td> | 201410109470.1 | 申請日: | 2014-03-21 |
| 公開(公告)號: | CN103993069B | 公開(公告)日: | 2020-04-28 |
| 發(fā)明(設計)人: | 丘坤龍;何銘輝 | 申請(專利權)人: | 深圳華大基因科技服務有限公司 |
| 主分類號: | C12Q1/70 | 分類號: | C12Q1/70;C12Q1/6869;G16B30/10 |
| 代理公司: | 深圳市興科達知識產權代理有限公司 44260 | 代理人: | 王翀 |
| 地址: | 518083 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 病毒 整合 捕獲 分析 方法 | ||
1.一種病毒整合位點捕獲測序分析方法,其特征在于,該方法包括:
參考序列構建步驟,將人的參考序列和病毒的參考序列合并在一起,構建一個混合參考序列;
數據過濾步驟,讀取測序數據,過濾該測序數據中不合格的部分,得到過濾后的測序數據;
數據比對步驟,利用比對軟件將處理后的測序數據比對到混合參考序列上,獲取一個比對結果,然后對該比對結果進行處理,得到一個用于檢測病毒整合的比對結果;
序列獲取步驟,根據該用于檢測病毒整合的比對結果,執(zhí)行相應的操作,獲取病毒整合的相關序列;
整合位點獲取步驟,綜合上述相關序列的比對信息,獲取病毒整合位點在混合參考序列上的坐標;及
分析結果輸出步驟,綜合整合位點的坐標信息,得到并輸出病毒整合結果,
所述數據過濾步驟包括:
去除含接頭的測序序列、不明確堿基型的堿基N的比例大于預設值的測序序列、及質量低于預設要求的測序序列,所述預設要求為:質量值Q≤5的堿基數占整個測序序列的50%以上;
所述序列獲取步驟包括:
序列獲取步驟一,從比對結果中挑出截短比對上的測序序列,根據比對位置將相似度大于預設值的序列合并,然后利用比對軟件,將被截掉的部分重新比對到混合參考序列上;及
序列獲取步驟二,從比對結果中挑出兩端都比對不上的雙末端測序序列,將測通的雙末端測序序列連成一條長序列,然后利用比對軟件,將連接好的長序列比對回混合參考序列上。
2.如權利要求1所述的病毒整合位點捕獲測序分析方法,其特征在于,在整合位點獲取步驟之后、分析結果輸出步驟之前,還包括:
整合位點進階分析步驟,根據病毒整合位點的坐標,尋找比對結果中支持整合的異常雙末端測序序列對的數目,并統計整合位點處的深度、整合位點上下游預設范圍的平均深度,
所述異常雙末端測序序列的尋找方法包括:
根據比對結果計算出平均插入片斷長度和標偏差,則異常雙末端測序序列滿足以下條件一與條件二:
條件一,比對結果中記錄的雙末端測序序列的插入片斷長度小于平均插入片斷長度減去4倍標準差或者大于平均插入片斷長度加上4倍標準差;
條件二,在上游染色體和下游染色體不同的條件下,整個片斷的實際長度大于或等于平均插入片斷長度減去4倍標準差并且小于或等于平均插入片斷長度加上4倍標準差。
3.如權利要求2所述的病毒整合位點捕獲測序分析方法,其特征在于,所述序列獲取步驟一包括:
根據比對結果中的軟截短reads比對上的部分的比對位置和reads被截短的方向,將軟截短reads分成若干組,同一組內的軟截短reads將截短的部分進行合并;
如果兩條序列的一致率達到預設值,則判定該兩條序列來自同一個斷點,將這兩條序列合并成一條最長序列,重復該步驟,將來自于同一斷點的同一方向的截短序列合并成一條最長序列。
4.如權利要求3所述的病毒整合位點捕獲測序分析方法,其特征在于,所述序列獲取步驟還包括:
對比對不準確的軟截短reads進行校正,然后再與已經合并好的截短序列進行合并,合并后的最長序列包括:左端截短的若干軟截短reads合并成的左端截短一致性序列,右端截短的若干軟截短reads合并成的右端截短一致性序列;
所述對比對不準確的軟截短reads進行校正的步驟包括:
根據兩個比對位置的差異,將過早截短reads的截短部分的序列補充指定部分到比對上的那部分序列中,再與合并后的比對上的序列進行比較,如果兩者一致率達到預設值,則合并成一個序列,同時reads支持數加上1。
5.如權利要求4所述的病毒整合位點捕獲測序分析方法,其特征在于,所述整合位點獲取步驟包括:
根據左端截短一致性序列和右端截短一致性序列的匹配結果和比對上部分的比對位置,確定整合位點在混合參考序列上的坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技服務有限公司,未經深圳華大基因科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410109470.1/1.html,轉載請聲明來源鉆瓜專利網。





