[發(fā)明專利]一種宏基因組數(shù)據(jù)分析方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810355681.1 | 申請日: | 2018-04-19 |
| 公開(公告)號: | CN108334750B | 公開(公告)日: | 2019-02-12 |
| 發(fā)明(設(shè)計)人: | 康悅;胡歡;程軍;周洲;任用 | 申請(專利權(quán))人: | 江蘇先聲醫(yī)學(xué)診斷有限公司;北京先聲醫(yī)學(xué)檢驗實驗室有限公司;中國醫(yī)學(xué)科學(xué)院阜外醫(yī)院 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 齊云 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 物種鑒定 數(shù)據(jù)分析 檢出 樣本 測序技術(shù) 宏基因組 物種 耐藥突變位點 鑒定病原體 測序平臺 耐藥基因 心內(nèi)膜炎 病原體 假陽性 映射 可用 算法 微生物 抽取 兼容 驗證 主流 | ||
1.一種宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法包括:
A1、將樣本的宏基因組測序序列與第一核酸數(shù)據(jù)庫進行比對,基于k-mer算法獲得初步物種鑒定結(jié)果;
A2、針對所述初步物種鑒定結(jié)果中的每個物種,統(tǒng)計支持序列的總數(shù)目,如果支持序列的總數(shù)目≥預(yù)定值,則隨機抽取部分支持序列,構(gòu)成驗證序列集,如果支持序列的總數(shù)目<預(yù)定值,則抽取全部支持序列,構(gòu)成驗證序列集;基于blast算法,在第二核酸數(shù)據(jù)庫中對所述驗證序列集中的序列進行物種鑒定,當(dāng)驗證序列集中50%以上序列的鑒定結(jié)果與所述初步物種鑒定結(jié)果一致,則所述初步物種鑒定結(jié)果通過驗證,所述初步物種鑒定結(jié)果即為樣本的報告檢出物種;
A3、計算每個報告檢出物種的支持序列的長度總和,經(jīng)所述報告檢出物種的基因組大小標(biāo)準(zhǔn)化后,得到所述報告檢出物種富集程度的參考值,以所述參考值為基準(zhǔn),計算每個報告檢出物種在所述樣本中的相對豐度。
2.根據(jù)權(quán)利要求1所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括:
B1、基于blast算法,將樣本的宏基因組測序序列與耐藥基因數(shù)據(jù)庫的核酸序列信息進行比對,獲得耐藥基因的初步鑒定結(jié)果;
B2、對所述耐藥基因的初步鑒定結(jié)果進行過濾,只保留支持序列對所述耐藥基因的序列覆蓋度>30%且不集中分布于所述耐藥基因的3’或5’端的鑒定結(jié)果,即為報告檢出耐藥基因。
3.根據(jù)權(quán)利要求2所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括:
B1’、基于blast算法,將樣本的宏基因組測序序列與耐藥基因數(shù)據(jù)庫的耐藥突變位點氨基酸序列進行比對,獲得耐藥突變位點的初步鑒定結(jié)果;
B2’、對所述耐藥突變位點的初步鑒定結(jié)果進行過濾,只保留長讀長支持序列的數(shù)目>2條或短讀長支持序列的數(shù)目>3的鑒定結(jié)果,即為報告檢出耐藥突變位點。
4.根據(jù)權(quán)利要求2所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括:B3、整合所述報告檢出耐藥基因,獲得樣本的全局耐藥結(jié)果。
5.根據(jù)權(quán)利要求3所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括:B3、整合所述報告檢出耐藥基因和所述報告檢出耐藥突變位點,獲得樣本的全局耐藥結(jié)果。
6.根據(jù)權(quán)利要求4或5所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括B4、根據(jù)所述樣本的報告檢出物種,將步驟B3所述全局耐藥結(jié)果映射到報告檢出物種。
7.根據(jù)權(quán)利要求1所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括在進行物種鑒定前,對所述宏基因組測序序列進行質(zhì)量評估和去宿主基因組。
8.根據(jù)權(quán)利要求2所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括在進行物種鑒定和耐藥基因鑒定前,對所述宏基因組測序序列進行質(zhì)量評估和去宿主基因組。
9.根據(jù)權(quán)利要求3所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述方法還包括在進行物種鑒定、耐藥基因鑒定和耐藥突變位點鑒定前,對所述宏基因組測序序列進行質(zhì)量評估和去宿主基因組。
10.根據(jù)權(quán)利要求7~9任一項所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述質(zhì)量評估包括:根據(jù)測序平均質(zhì)量分?jǐn)?shù)、質(zhì)量分?jǐn)?shù)分布以及測序長度中的至少一種評估測序數(shù)據(jù)的可用性,對可用數(shù)據(jù)中的低質(zhì)量部分進行過濾處理。
11.根據(jù)權(quán)利要求10所述的宏基因組數(shù)據(jù)分析方法,其特征在于,所述過濾處理包括:對于長讀長測序數(shù)據(jù),保留長度>500 bp且測序質(zhì)量分?jǐn)?shù)>6的測序數(shù)據(jù);對于短讀長測序數(shù)據(jù)保留長度>50bp且質(zhì)量分?jǐn)?shù)>20的測序數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇先聲醫(yī)學(xué)診斷有限公司;北京先聲醫(yī)學(xué)檢驗實驗室有限公司;中國醫(yī)學(xué)科學(xué)院阜外醫(yī)院,未經(jīng)江蘇先聲醫(yī)學(xué)診斷有限公司;北京先聲醫(yī)學(xué)檢驗實驗室有限公司;中國醫(yī)學(xué)科學(xué)院阜外醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810355681.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)分析裝置、數(shù)據(jù)分析方法
- 用于工程改變數(shù)據(jù)分析的方法和系統(tǒng)
- 一種統(tǒng)一數(shù)據(jù)分析服務(wù)
- 數(shù)據(jù)分析方法、數(shù)據(jù)處理裝置和計算機可讀存儲介質(zhì)
- 數(shù)據(jù)分析應(yīng)用的管理方法、裝置、系統(tǒng)和存儲介質(zhì)
- 電力科研生產(chǎn)數(shù)據(jù)分析方法、裝置、系統(tǒng)及存儲介質(zhì)
- 數(shù)據(jù)分析方法及數(shù)據(jù)分析器
- 數(shù)據(jù)分析設(shè)備、數(shù)據(jù)分析方法和數(shù)據(jù)分析程序
- 一種大數(shù)據(jù)分析系統(tǒng)
- 一種數(shù)據(jù)分析方法、裝置、設(shè)備和存儲介質(zhì)





