[發明專利]一種利用宏基因組數據分析微生物群體功能的方法有效
| 申請號: | 201810644958.2 | 申請日: | 2018-06-21 |
| 公開(公告)號: | CN108804875B | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 米雙利;邢志凱;郭翀曄;李蒙 | 申請(專利權)人: | 中國科學院北京基因組研究所 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B40/30;G16B50/00;C12Q1/689;C12Q1/10;C12Q1/06;C12Q1/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王文君;陳征 |
| 地址: | 100101 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 宏基 數據 分析 微生物 群體 功能 方法 | ||
1.一種利用宏基因組數據分析微生物群體功能的方法,其特征在于,包括以下步驟:
(1)構建微生物宏基因組參考數據庫;所述參考數據庫包括微生物物種數據集和微生物基因和功能數據集;
所述微生物物種數據集整合廣泛宿主和環境來源的微生物物種信息,并通過以下方法制備得到:
1)下載生物信息數據庫中不同來源不同種類的所有微生物的全部基因組序列數據;所述的生物信息數據庫為NCBI、IMG、KEGG、COG、EMBL、DDBJ、CAZY、UniProt、PDB或ASDB;
2)下載生物信息庫中不同來源不同種類的所有微生物的注釋文件,從注釋文件中提取相關物種的門、綱、目、科、屬、種分類信息;所述的生物信息數據庫為NCBI、IMG、KEGG、COG、EMBL、DDBJ、CAZY、UniProt、PDB或ASDB;
3)將步驟1)和2)中來源于不同生物信息庫的微生物根據基因組序列相似度和物種分類信息,進行冗余微生物的篩選和去除,生成一個包括所有微生物序列和物種分類信息的微生物物種數據集,并對這一數據集中所有微生物的序列及分類信息進行統一編號;
所述微生物基因和功能數據集整合廣泛宿主和環境來源的微生物基因信息和功能的注釋信息,并通過以下方法制備得到:
4)下載前述生物信息數據庫中,且在所述的微生物物種數據集中有統一編號的微生物的具有編碼能力CDS區的基因序列文件;
5)下載生物信息數據庫中所有微生物的注釋文件并提取其中所有基因名稱、基因ID號、基因功能注釋信息、編碼蛋白名稱,根據基因名稱和編碼蛋白名稱,從所有整合了基因功能的生物信息數據中提取所有基因對應的信號通路和作用功能分類的信息;
6)結合上述步驟4)-5)的信息,生成一個包括有統一編號的所有微生物CDS序列、基因信息、蛋白功能、作用信號通路及其功能分類信息的微生物基因和功能數據集;
(2)對待測微生物群體的宏基因組進行測序,對測序數據進行質量控制,獲得高質量的全基因組測序數據;
(3)將步驟(2)獲得的高質量的全基因組測序數據與步驟(1)的微生物宏基因組參考數據庫中的微生物物種數據集進行比對,計算物種豐度,得到測序數據中所有物種的豐度值,分析不同樣本間微生物的組成差異或相同樣本中微生物的多樣性;
(4)將步驟(2)獲得的高質量的全基因組測序數據與步驟(1)的微生物宏基因組參考數據庫中的微生物基因和功能數據集進行比對,計算基因豐度,得到測序數據中所有基因的豐度值,分析不同樣本間基因水平的差異或整體評價待測微生物群體中基因功能水平或評價待測微生物群體中個別微生物基因功能水平;
(5)對所得基因進行基因功能注釋,將有相同功能的基因進行聚類,得到多個包含不同基因的功能模塊;每個功能模塊中,去除具有相同基因豐度和功能的冗余基因;
將各個功能模塊中所有非冗余基因的相關豐度進行加和計算,得到所有功能模塊的豐度值,對待測樣本微生物的功能進行差異比較分析或整體評價。
2.如權利要求1所述的方法,其特征在于,步驟(2)中對測序數據進行質量控制,同時將來源于宿主DNA的reads去除,以便減少樣本提取和測序過程中可能產生的誤差,從而得到高質量的全基因組測序數據。
3.如權利要求1或2所述的方法,其特征在于,步驟(2)所述待測微生物群體為任意宿主來源任意環境下的微生物群體。
4.權利要求1或2所述的方法的用途,所述用途為以下任一:
1)不同宿主來源和/或環境、特定來源和/或環境下的微生物群體功能分析;
2)不同宿主來源和/或環境、特定來源和/或環境下的特定微生物的功能分析;
3)不同宿主來源和/或環境、特定來源和/或環境下的微生物物種分類分析;
4)獲得不同宿主來源和/或環境、特定來源和/或環境下的微生物基因;
5)獲得具有特定功能的微生物;
6)評價宿主特定環境下微生物群體狀態;
7)評價宿主病理表型特征;
8)提高微生物宏基因組測序數據的利用率;
9)小樣本量的微生物群體功能分析;
10)特定環境下所有微生物的相互協作關系,以及微生物與環境之間或微生物與宿主之間的相互影響關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院北京基因組研究所,未經中國科學院北京基因組研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810644958.2/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





