[發明專利]細菌鑒定和分型分析基因組數據庫及鑒定和分型分析方法有效
| 申請號: | 202110250916.2 | 申請日: | 2021-03-08 |
| 公開(公告)號: | CN112863606B | 公開(公告)日: | 2022-07-26 |
| 發明(設計)人: | 陳歡;梁倩;徐榮;王瑩;劉程智;何陸平 | 申請(專利權)人: | 杭州微數生物科技有限公司 |
| 主分類號: | G16B50/00 | 分類號: | G16B50/00;C12Q1/689 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林松海 |
| 地址: | 311100 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 細菌 鑒定 分析 基因組 數據庫 方法 | ||
1.一種細菌鑒定和分型分析基因組數據庫,其特征在于,構建步驟如下:
1)菌種信息收集
1.1)從NCBI(National Center for Biotechnology Information,美國國家生物技術信息中心)收集細菌基因組,包括細菌基因組序列、“菌株”、“培養物收集”、“克隆”和“注釋”元信息,從中篩選模式菌株;
1.2)獲取來自LPSN(The List of Prokaryotic names with Standing inNomenclature)的有效發布的細菌名稱和類型菌株列表;
1.3)查閱伯杰氏細菌系統學手冊第2版和IJSEM《國際系統與進化微生物學雜志》的文章,確定合格發表的物種名稱和對應的模式菌株菌株號;
1.4)根據步驟1.3)物種名稱和菌株號對步驟1.1)獲取的基因組序列和元信息進行篩選,獲取合格的菌株細菌基因組進入到數據庫進行管理;
2)數據庫中的基因組序列質量控制
2.1)使用基于譜系標記基因集的CheckM評估每個基因組的完整性和污染率,將污染率>5%或完整度小于90%的基因組從數據庫中剔除;
2.2)已進行注釋的基因組直接提取其中的16S rRNA基因序列,對于未進行注釋的基因組使用RNAmmer進行提取,將這些16S rRNA基因序列與LTP數據庫進行比對,以檢查一致性,如存在屬水平不一致,通過查閱IJSEM文獻,調查是否進行了更名,如未改名判定為污染,將污染基因組去除;
2.3)對任意兩個基因組之間進行成對ANI(Average nucleotide identity )計算,以推斷錯誤標記的基因組,通過查閱IJSEM文獻,調查是否進行了更名,否則判定錯誤標識,將錯誤標識基因組去除;
應用所述的細菌鑒定和分型分析基因組數據庫進行細菌鑒定和分型分析,步驟如下:
a)提取待鑒定細菌基因組中的16S rRNA序列與LTP數據庫進行比對;
b)利用Kmerfinder,從待鑒定細菌基因組中提取的K-mers與細菌基因組數據庫的K-mer數據庫進行比對;
c)分別獲取步驟a)、步驟b)中篩選得到的排名前20個細菌ID號,并從細菌基因組數據庫中提取所述細菌ID號的基因組序列,利用fastANI計算查詢待鑒定基因組與所述細菌ID號的基因組序列的ANI數值;最后,鑒定結果只返回最接近的物種且ANI數值大于95%。
2.根據權利要求1 所述的細菌鑒定和分型分析基因組數據庫,其特征在于,
對基因組數據庫中的模式菌株基因組進行16S rRNA序列提取,提取了25,209條,長度大于300的模式菌株16S rRNA基因序列,和LTP包含的16S rRNA基因序列合并,形成可用于鑒定的16S rRNA序列數據庫。
3.根據權利要求1 所述的細菌鑒定和分型分析基因組數據庫,其特征在于,
刪除416個錯誤標簽和低質量的基因組,包括331個污染率5%或者完整度小于90%的,15個16S異質性的,12個基因組大小和GC含量異常的,13個ANI值與同種type95的,45個ANI聚類樹同屬異常的基因組;
最終構建的數據庫中所有基因組均來自于合格發表物種的模式菌株,包含序列、雙名法命名的物種拉丁名、菌株號信息;
構建的基因組數據庫中所有基因組質量滿足污染率<%5且完整度>90%。
4.根據權利要求1 所述的細菌鑒定和分型分析基因組數據庫,其特征在于,所述的細菌鑒定和分型分析基因組數據庫周期性或者實時更新。
5.根據權利要求1 所述的細菌鑒定和分型分析基因組數據庫,其特征在于,通過在線數據分析平臺,用戶通過瀏覽器直接訪問并提交待鑒定細菌基因組進行細菌鑒定和分型分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州微數生物科技有限公司,未經杭州微數生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110250916.2/1.html,轉載請聲明來源鉆瓜專利網。





