[發(fā)明專利]測序數(shù)據(jù)讀段重新比對的方法在審
| 申請?zhí)枺?/td> | 201780077066.2 | 申請日: | 2017-11-15 |
| 公開(公告)號: | CN110168647A | 公開(公告)日: | 2019-08-23 |
| 發(fā)明(設(shè)計)人: | G·貝里;莊瀚宇;J·戈登;陳曉;S·坦納 | 申請(專利權(quán))人: | 宜曼達(dá)股份有限公司 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 北京律盟知識產(chǎn)權(quán)代理有限責(zé)任公司 11287 | 代理人: | 王允方 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 比對 比對處理 參考序列 測序數(shù)據(jù) 序列比對 扁平化 數(shù)據(jù)集 選擇標(biāo)準(zhǔn) 近端 去除 引入 創(chuàng)建 | ||
1.一種用于測序數(shù)據(jù)讀段重新比對的計算機實施方法,所述方法包括:
從序列比對數(shù)據(jù)集獲得讀段序列與參考序列的初始比對,所述初始比對包括比對讀段;
對所述初始比對進(jìn)行重新比對處理,所述重新比對處理將所述讀段序列與所述參考序列重新比對以產(chǎn)生一或多個候選重新比對,并且所述重新比對處理包括:
鑒定一或多個候選插入缺失,所述一或多個候選插入缺失包括所述比對讀段中的零或多個插入缺失以及在所述比對讀段近端比對的零或多個插入缺失,如所述序列比對數(shù)據(jù)集指示;
至少基于從所述比對讀段中去除由所述初始比對指示的任何插入缺失來創(chuàng)建扁平化比對讀段;和
基于針對所述一或多個候選重新比對中的每個候選重新比對將所述一或多個候選插入缺失中的至少一個相應(yīng)候選插入缺失引入所述扁平化比對讀段來確定所述讀段序列與所述參考序列的所述一或多個候選重新比對;和
基于一或多個選擇標(biāo)準(zhǔn)來提供所述初始比對或所述一或多個候選重新比對中的所選候選重新比對。
2.根據(jù)權(quán)利要求1所述的方法,其中所述一或多個候選插入缺失包括多個候選插入缺失,并且其中所述確定所述一或多個候選重新比對包括開始迭代地將所述多個候選插入缺失引入所述扁平化比對讀段,其中所述迭代引入的每次迭代是通過將所述候選重新比對的所述至少一個相應(yīng)候選插入缺失引入所述扁平化比對讀段來提供所述一或多個候選重新比對中的候選重新比對。
3.根據(jù)權(quán)利要求2所述的方法,其中所述迭代引入是將所述多個候選插入缺失中的一或多個候選插入缺失的排列引入所述扁平化比對讀段,以針對所述排列中的每個排列獲得所述一或多個候選比對中的不同候選重新比對。
4.根據(jù)權(quán)利要求3所述的方法,其中所述重新比對處理進(jìn)一步包括:
檢查所述一或多個候選重新比對中的所提供候選重新比對,以確定所提供候選重新比對中的比對讀段,即具有所引入的一或多個相應(yīng)候選插入缺失的所提供候選重新比對中的所述比對讀段,是否與所述參考序列比對并且所提供候選重新比對中的所述比對讀段和所述參考序列之間不存在錯配堿基;
基于確定所提供候選重新比對中的所述比對讀段與所述參考序列比對并且不存在錯配堿基來停止所述迭代引入;和
選擇所提供候選重新比對作為所選候選重新比對,其中所述提供是基于所提供候選重新比對中的所述比對讀段與所述參考序列比對來輸出所選候選重新比對。
5.根據(jù)權(quán)利要求2所述的方法,其中所述重新比對處理進(jìn)一步包括針對所述迭代引入對所述多個插入缺失進(jìn)行優(yōu)先級排序,其中所述迭代引入是基于所述優(yōu)先級排序按優(yōu)先級順序引入所述多個插入缺失。
6.根據(jù)權(quán)利要求5所述的方法,其中所述優(yōu)先級排序使參考插入缺失數(shù)據(jù)集指示為預(yù)知插入缺失的插入缺失優(yōu)先于所述參考插入缺失數(shù)據(jù)集未指示為預(yù)知插入缺失的插入缺失。
7.根據(jù)權(quán)利要求5所述的方法,其中所述優(yōu)先級排序使較長長度的插入缺失優(yōu)先于較短長度的插入缺失。
8.根據(jù)權(quán)利要求5所述的方法,其中所述優(yōu)先級排序使所述序列比對數(shù)據(jù)集的較大數(shù)量的比對讀段中所指示的插入缺失優(yōu)先于所述序列比對數(shù)據(jù)集的較小數(shù)量的比對讀段中所指示的插入缺失,或者所述優(yōu)先級排序使所述序列比對數(shù)據(jù)集中的與所述插入缺失相對于所述參考序列的位置對應(yīng)的較大比例的比對讀段中所指示的插入缺失優(yōu)先于所述序列比對數(shù)據(jù)集中的較小比例的比對讀段中所指示的插入缺失。
9.根據(jù)權(quán)利要求5所述的方法,其中在所述序列比對數(shù)據(jù)集中的相同數(shù)量的比對讀段中所指示的不同插入缺失之間,所述優(yōu)先級排序使相對于所述序列比對數(shù)據(jù)集中所指示的參考基因組序列的位置在相對于所述參考基因組序列的針對另一插入缺失指示的位置上游的插入缺失優(yōu)先。
10.根據(jù)權(quán)利要求1所述的方法,其中所述選擇標(biāo)準(zhǔn)至少部分地基于以下中的一或多個:錯配堿基的數(shù)量、插入缺失的數(shù)量、插入缺失相對于所述序列比對數(shù)據(jù)集所指示的參考基因組序列的位置,和軟切堿基的數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于宜曼達(dá)股份有限公司,未經(jīng)宜曼達(dá)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780077066.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 晶圓機臺測試檔案的比對裝置以及比對方法
- 比對系統(tǒng)中的故障處理方法及裝置
- 基于主機算法處理的超聲波探頭檢測系統(tǒng)
- 一種數(shù)據(jù)一致性處理方法和系統(tǒng)
- 光譜處理比對裝置、處理比對方法以及藥品真?zhèn)闻卸ㄏ到y(tǒng)
- 數(shù)據(jù)比對方法及裝置
- 圖像處理方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)
- 一種數(shù)據(jù)比對方法、裝置、終端和存儲介質(zhì)
- 一種基于近內(nèi)存計算結(jié)構(gòu)的基因比對加速方法和系統(tǒng)
- 一種數(shù)據(jù)比對方法及系統(tǒng)、任務(wù)控制器、存儲介質(zhì)





