[發明專利]一種用于宏基因組測序數據的微生物物種與功能組成分析方法在審
| 申請號: | 202011592565.5 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112599198A | 公開(公告)日: | 2021-04-02 |
| 發明(設計)人: | 李鴻毅;曲昊淼;寇文伯;薛正晟;孫子奎 | 申請(專利權)人: | 上海派森諾生物科技股份有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B50/00 |
| 代理公司: | 上海點威知識產權代理有限公司 31326 | 代理人: | 胡志強 |
| 地址: | 200030 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 宏基 序數 微生物 物種 功能 組成 分析 方法 | ||
本發明公開了一種用于宏基因組測序數據的微生物物種與功能組成分析方法,包括下列步驟:1)切除原始數據中的接頭序列片段、低質量片段,濾除過短序列、含模糊堿基序列;2)使用上述獲得的數據進行物種注釋,3)對剔除非目物種后的序列進行拼接,4)對疊連群序列進行相似性聚類,5)使用blastn算法,6)預測非冗余的疊連群序列中的基因區域,7)將非冗余蛋白序列集與各類蛋白注釋數據庫進行比對,8)計算基因序列豐度,本發明滿足了拼接產生的疊連群序列的進一步分析,避免了結果假陽性高,依賴于專用數據庫的構建,適用面窄的問題;靈敏度高,提高了準確性。
技術領域
本發明涉及微生物基因分析領域,尤其涉及一種用于宏基因組測序數據的微生物物種與功能組成分析方法。
背景技術
隨著下一代高通量測序技術(Next Generation Sequencing,NGS)的不斷發展,人們對于微生物群落方面的研究也越來越全面和深入。區別于常見的靶向微生物核糖體RNA基因的擴增子測序技術,宏基因組學是將整個群落系統中全體微生物的基因組作為研究對象,基于鳥槍法測序技術,全面展現整個群落的物種組成和功能潛能組成,進而闡明微生物群落的作用機制。然而,由于測序樣本類型的多樣,樣本量規模、測序深度的多變,以及宿主、污染基因組的多少等因素,以及分析本身的復雜性,研究者們發開出了數量龐大的各類軟件,以及配套的更為復雜的各種分析模式、參數和數據庫。目前,只有少數幾個流程軟件或分析網站提供了自動化的宏基因組分析方法或服務。其中,以MG-RAST(https://www.mg-rast.org/)和IMG/M(https://img.jgi.doe.gov/cgi-bin/m/main.cgi)等(宏)基因組數據庫網站為代表,它們在提供數據上傳和存儲服務的同時,也提供了有限種類的分析項目和計算資源。而另一類軟件,如HUMAnN2(http://www.huttenhower.org/humann2)以及發明專利“一種宏基因組數據分析方法及系統”(CN 108334750 B)等,則是基于非拼接序列數據的數據庫比對注釋,也就是說,其物種或基因的鑒定,主要依賴于數據庫對目標樣本的微生物基因組的覆蓋度。然而,對于環境樣本,如土壤,底泥,極端環境,我們對于微生物群落的認識是極其有限的,因而此類分析流程,適用的樣本類型也是有限,主要以人體相關樣本為宜。
這些現有的宏基因組分析流程具有如下缺陷:
(1)未包含拼接步驟,無法滿足基于拼接產生的疊連群序列的進一步分析。
(2)物種分類學注釋依靠非拼接序列數據的比對分析,未包含序列拼接并基于拼接后的數據進行相應鑒定,因而結果假陽性高,依賴于專用數據庫的構建,適用面有限。
(3)對于樣本中基因的鑒定,主要采用比對方式,依賴于專用數據庫的構建,假陽性高,靈敏度低,適用范圍有限。
(4)未包含宿主和/或污染基因組序列去除步驟,或去除步驟依賴于宿主和/或污染基因組的存在。
發明內容
本發明的提供一種用于宏基因組測序數據的微生物物種與功能組成分析方法。
本發明的方案是:
一種用于宏基因組測序數據的微生物物種與功能組成分析方法,包括下列步驟:
1)切除原始數據中的接頭序列片段、低質量片段,濾除過短序列、含模糊堿基序列;若已知宿主基因組,則將宿主序列剔除;
2)使用上述獲得的數據進行物種注釋,并統計物種序列數即為豐度,再基于注釋結果剔除注釋到非目的物種的序列;
3)對剔除非目物種后的序列進行拼接,獲得疊連群序列;
4)對疊連群序列進行相似性聚類,并計算各樣本非冗余的疊連群序列豐度,并去掉總豐度為零的序列;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海派森諾生物科技股份有限公司,未經上海派森諾生物科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011592565.5/2.html,轉載請聲明來源鉆瓜專利網。





