[發(fā)明專利]一種基于大數(shù)據(jù)預(yù)測核心微生物組的方法在審
| 申請?zhí)枺?/td> | 202110901600.5 | 申請日: | 2021-08-06 |
| 公開(公告)號: | CN113656565A | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計)人: | 錢海豐;張琦;張振炎 | 申請(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/335;G16B40/00 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 預(yù)測 核心 微生物 方法 | ||
1.一種基于大數(shù)據(jù)預(yù)測核心微生物組的方法,其特征在于,所述方法包括如下步驟:
(1)確定目標系微生物群落,根據(jù)關(guān)鍵詞“目標+microbial community”、“目標+16SrRNA”、“目標+microbiome”和“目標+microbiota”檢索文獻,找到相關(guān)獨立實驗,整合所有獲取的文獻內(nèi)容以及確定數(shù)據(jù)集的可獲取性和可利用性;
(2)通過統(tǒng)計整合后的數(shù)據(jù)集信息表格,得到每個獨立實驗的實驗信息,統(tǒng)一在線數(shù)據(jù)庫獲取每個獨立實驗的測序原始數(shù)據(jù);
(3)分析對每個獨立實驗的測序原始數(shù)據(jù)進行質(zhì)量過濾、雙端合并、樣品合并、序列去冗余、聚類并且去除嵌合體,得到每個物種序列數(shù)和OTU表格;
(4)將每個獨立實驗得到的序列和OTU表格導(dǎo)入QIIME2中進行不同實驗的數(shù)據(jù)合并、物種注釋、宿主序列去除和序列抽平,獲得歸一化分類物種表格和每個物種的檢出序列數(shù);
(5)選取一個物種分類水平作為核心微生物組的基礎(chǔ)分類,從步驟(4)得到的歸一化分類物種表格中篩選出每個獨立實驗檢出的物種在該獨立實驗所有樣品中的檢出頻率大于50%,然后根據(jù)這些物種進行計算所有獨立實驗中的檢出頻率;
(6)以獲取的所有獨立實驗的樣品數(shù)為基礎(chǔ),計算每個物種的檢出頻率;
(7)根據(jù)步驟(4)得到的每個物種的檢出序列數(shù)除以步驟(4)中抽平的序列數(shù)計算出每個物種的相對豐度;
(8)根據(jù)步驟(5)~(7)中計算的指標整合計算每個物種的核心指數(shù),根據(jù)公式計算:
其中,CI是16S rRNA測序元數(shù)據(jù)中每個物種的核心指數(shù),f是每個物種在所有樣本中的檢出頻率,n是包含每個物種的獨立實驗數(shù)量,s是每個物種在所有樣本中的序列數(shù),N是獨立實驗的總數(shù),S是所有樣本的總序列數(shù)即步驟(4)中抽平的序列數(shù),s/S是每個物種的相對豐度;
(9)將目標微生物群落的物種核心指數(shù)歸一化,根據(jù)公式計算:
其中,NorCI是目標群落的某個物種CI的核心指數(shù),CImin和CImax分別是目標微生物群的最小和最大CI;
(10)為了同時保證步驟(5)中計算的100%獨立實驗中的檢出頻率,95%的所有樣本的檢出頻率和前1%豐富度,將NorCI0.8的物種定義為該目標微生物群落的核心物種。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110901600.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





