[發明專利]一種基于高通量測序數據的枯萎病發病預測模型及應用在審
| 申請號: | 202010160122.2 | 申請日: | 2020-03-10 |
| 公開(公告)號: | CN111243676A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 袁軍;沈其榮;文濤 | 申請(專利權)人: | 南京農業大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B30/00;G16B5/00 |
| 代理公司: | 南京天華專利代理有限責任公司 32218 | 代理人: | 莫英妍;徐冬濤 |
| 地址: | 211225 江蘇省南京市溧*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 通量 序數 枯萎病 發病 預測 模型 應用 | ||
1.一種基于高通量測序數據的枯萎病發病預測模型,其特征在于,包括以下步驟:
步驟1:數據收集:使用關鍵詞從數據庫中獲取枯萎病相關的土壤微生物群落的測序樣品登錄號,進而獲取枯萎病相關的土壤微生物群落的原始測序數據;
步驟2:數據處理:將土壤微生物群落的測序數據分為細菌原始測序數據和真菌原始測序數據,分別進行處理和分析;
步驟3:將土壤中的細菌群落和真菌群落作為生物標志物來區分枯萎病發病土壤和健康土壤,應用機器學習模型隨機森林RF對區分枯萎病發病土壤和健康土壤的細菌群落和真菌群落分別建立分類模型:
步驟3-1:構建用于區分枯萎病發病土壤微生物群落和健康土壤微生物群落的細菌模型:
使用隨機森林創建分類模型,利用版本號為v.4.6-14的RF軟件包中的randomForest函數構建隨機森林模型并設置參數ntree=1000,其他參數保持默認,將細菌群落組成的相對豐度按門、綱、目、科、屬、種和OTU等級別進行建模,獲得最佳預測模型的細菌分類級別;
對于每個細菌群落分類級別,將所有整合得到的細菌測序樣本隨機分為兩部分,一部分占全部樣本的三分之二,用于模型構建,另一部分占總樣本三分之一,用于細菌模型預測,這個過程重復五次,通過模型預測數據評估最佳模型,從而獲得預測準確率最高的用于建模的細菌分類級別;
在準確率最高的分類級別上,將步驟2中的整合的全部細菌原始測序數據組成訓練集,使用相同的模型并設置相同的參數繼續訓練模型,進而優化所生成的預測枯萎病發病的細菌模型;
通過交叉檢驗提取出來對模型影響最大的若干個OTU。
步驟3-2:構建用于區分枯萎病發病土壤微生物群落和健康土壤微生物群落的真菌模型:
利用R語言中的版本號為v.4.6-14的RF軟件包中的randomForest函數構建隨機森林模型并設置參數ntree=1000,其他參數保持默認,將真菌群落組成的相對豐度按門、綱、目、科、屬、種和OTU等級別進行分類建模,獲得最佳預測模型的真菌分類級別;
對于每個真菌群落分類級別,將所有整合得到的真菌測序樣本隨機分為兩部分,一部分占全部樣本的三分之二,用于模型構建,另一部分占總樣本三分之一,用于真菌模型預測,這個過程重復五次,通過模型預測數據評估最佳模型,從而獲得預測準確率最高的用于建模的真菌分類級別;
在準確率最高的分類級別上,將步驟2中的整合的全部真菌原始測序數據組成訓練集,使用相同的模型并設置相同的參數繼續訓練模型,進而優化所生成的預測枯萎病發病的真菌模型。
通過交叉檢驗提取出來對真菌模型影響最大的若干個OTU。
2.根據權利要求1所述的基于高通量測序數據的枯萎病發病預測模型,其特征在于,所述步驟1中的關鍵詞包括枯萎病發病和健康土壤的微生物群落、枯萎病土壤微生物結構。
3.根據權利要求1所述的基于高通量測序數據的枯萎病發病預測模型,其特征在于,所述步驟3中的細菌模型和真菌模型分別包含45個細菌OTU和40個真菌OTU的分類及豐度信息。
4.根據權利要求1所述的基于高通量測序數據的枯萎病發病預測模型,其特征在于,所述步驟2中對測序數據的處理和分析具體包括:拼接雙端原始測序數據,過濾低質量序列,并基于參考數據庫聚類操作分類單元OTU,將OTU分配到微生物門類信息。
5.根據權利要求4所述的基于高通量測序數據的枯萎病發病預測模型,其特征在于,所述參考數據庫包括細菌參考數據庫Greengene V 13.5和真菌參考數據庫Unite。
6.一種基于權利要求1-5任一的基于高通量測序數據的枯萎病發病預測模型在土壤枯萎病發病預測中的應用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京農業大學,未經南京農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010160122.2/1.html,轉載請聲明來源鉆瓜專利網。





