[發明專利]一種基于人腸道菌群的自動化分型方法在審
| 申請號: | 202010313064.2 | 申請日: | 2020-04-20 |
| 公開(公告)號: | CN111524555A | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 王樹偉;肖云平;史賢俊;林博;張建明 | 申請(專利權)人: | 上海歐易生物醫學科技有限公司 |
| 主分類號: | G16B40/30 | 分類號: | G16B40/30 |
| 代理公司: | 蘇州中合知識產權代理事務所(普通合伙) 32266 | 代理人: | 劉召民 |
| 地址: | 201114 上海市閔*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 腸道 自動 化分 方法 | ||
本發明公開了一種基于人腸道菌群的自動化分型方法,采用LEfSe方式對聚類結果分組進行Biomarker篩選,然后確定具體腸型,結果全面,包含涉及到的聚類圖、Biomarker篩選、腸型boxplot圖展示,可自動整理所有分析結果,每一步分析完成之后自動對結果進行匯總統計,可視化,而且,所有操作步驟可以溯源,方便錯誤查詢,如果分析報錯,會有對應的報錯日志信息。
技術領域
本發明涉及高通量微生物測序領域,具體涉及一種基于人腸道菌群的自動化分型方法。
背景技術
2011年一家歐洲的科研機構利用一個細菌基因的差異性對22名歐洲人腸道微生物的組成情況進行了分析,鑒別出了每個人之間以及同一個人體內微生物生態組不同的組成情況。并且,他們還將這些歐洲人的微生物生態組組成模式和早前發現的日本人和美國人的微生物生態組組成模式進行了比對。結果卻發現這些微生物生態組并不是隨機組合而成的,微生物生態組在所有這些受檢人群中大致可以分為三種類型,又稱作腸道型(Enterotype),科學家們將它們具體分為擬桿菌型(Bacteroides)、普氏菌型(Prevotella)和瘤胃球菌型(Ruminococcus),意指它們分別含有較多的擬桿菌、普氏菌或瘤胃球菌。對更大規模的人群(154名美國人和85名丹麥人)進行調查也得到了同樣的結論,他們同樣可以分為這三種類型,這說明其實在我們人體的腸道內真正存活得非常好的微生物生態組可能數量并不太多。
2011年4月,MetaHIT聯盟發表了在人體腸道微生物群中發現腸型(Arumugam,Raes等,2011)。相關研究的數據是公開的,在文章的補充信息中解釋了計算過程背后的理論。然而,附錄中并沒有報道(在R環境中)能夠讓任何人復制文章中所有數據的確切命令集和具體的腸型鑒定方法及完整的可視化展示。
現有腸型鑒定存在如下缺陷:
(1)腸型鑒定不明確:每個聚類結果的腸型鑒定方法不明確;
(2)結果展示不完整:分析結果過于簡單,數據挖掘得不夠深入,缺少數據對應的可視化展示內容。
發明內容
為了克服現有技術所存在的缺陷,本發明的目的在于提供一種基于人腸道菌群的自動化分型方法。
為了實現上述目的,本發明所采用的方案是:
一種基于人腸道菌群的自動化分型方法,包括如下步驟:
1)準備所有樣品的屬水平物種相對豐度表;
2)通過環繞中心點分割算法(PAM)進行分區,對豐度分布進行聚類,并使用Calinski-Harabasz(CH/卡林斯基-哈拉巴斯)指數篩選最佳聚類個數;
3)通過輪廓驗證技術對聚類效果進行驗證;
4)根據最佳聚類個數進行BCA類間分析;
5)通過LEfSe分析篩選出每組中對差異貢獻最大的物種作為每個組的腸型,
并繪制boxplot圖。
優選地,步驟2)中,Calinski-Harabasz指數定義為:
其中Bk是聚類間平方和,Wk是聚類內平方和,選擇使CKk值最大的k簇的數目。
優選地,步驟3)中,各數據點i的輪廓寬度S(i)由下式計算:
其中a(i)是樣本i與同一簇中所有其他樣本的平均差值(或距離),b(i)是樣品i與最近簇中所有對象的平均差值(或距離),
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海歐易生物醫學科技有限公司,未經上海歐易生物醫學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010313064.2/2.html,轉載請聲明來源鉆瓜專利網。





