[發明專利]一種基于腸道菌群預測模型集成學習的年齡預測方法在審
| 申請號: | 202111360059.8 | 申請日: | 2021-11-17 |
| 公開(公告)號: | CN114093515A | 公開(公告)日: | 2022-02-25 |
| 發明(設計)人: | 王鴻超;陳宇濤;陸文偉;朱金林;趙建新;張灝;陳衛 | 申請(專利權)人: | 江南大學 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H10/60;G16H50/50 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 張碧珂 |
| 地址: | 214122 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 腸道 預測 模型 集成 學習 年齡 方法 | ||
本發明公開了一種基于腸道菌群預測模型集成學習的年齡預測方法,包括:獲取人類腸道菌群宏基因組學的原始數據,將獲得的基因組數據進行質量控制,并獲取腸道菌群物種組成和代謝通路組成豐度表,構建樣本數據集;然后對樣本數據集進行特征選擇;使用篩選后的特征結合宿主地域信息構建多類年齡預測模型,并采用網格搜索確定使得預測模型精度更高的超參數并對各個最佳預測模型進行訓練和預測,得到集成年齡預測方法;最后利用確定的腸道菌群特征和集成年齡預測方法預測樣本的年齡,并通過特征解釋確定與年齡相關的關鍵物種和通路。本發明采用了集成學習方法,有效提高了年齡預測準確率;并且能夠定向指導腸道菌群的調整,進而實現抗衰老干預。
技術領域
本發明涉及一種基于腸道菌群預測模型集成學習的年齡預測方法,屬于微生物和計算機科學的交叉技術領域。特別地,本發明涉及一種基于腸道菌群預測模型集成學習的成年人年齡預測方法。
背景技術
人的衰老是一個持續不斷的過程,其會導致機體器官的生理功能降低,進而導致疾病的產生。隨著人類微生物組計劃等腸道菌群測序項目的展開,對于腸道菌群和宿主機體互作的認知不斷加深。研究表明,腸道菌群的組成、功能及其代謝產物等會隨著年齡而不斷發生變化,而腸道菌群的年齡特異性的變化同時也會進一步的影響宿主的腸道營養狀態等,從而影響機體慢性炎癥和衰弱進程。因此,腸道菌群和衰老的關聯在調控人體健康方面具有重要作用,基于腸道菌群能夠實現對于衰老進程的干預。但由于腸道菌群其物種及功能組成較為復雜,并且在物種組成、基因家族以及代謝通路等層面都存在著特征維度高,相互作用關系多等特點,因此,現有技術中尚缺乏統一并且可靠的將多角度腸道菌群特征與年齡表征相關聯的研究方法,因而難以實現確定與年齡相關的腸道菌群標志物的鑒別。
隨著測序技術的發展,宏基因組測序使得能夠對腸道菌群實現全面的表征,相較于以往的16s rRNA測序,宏基因組側測序不僅能夠實現物種水平的物種注釋,還能夠進一步的研究腸道菌群的代謝通路及基因家族的組成,是深入研究腸道菌群的有利工具。通過宏基因組測序手段結合生物信息學分析工具、機器學習模型算法,為探究腸道菌群其物種、功能及基因等與宿主健康狀態之間的關聯提供了方法支持,不斷更新擴展的基因組數據庫則為大規模的分析提供了數據基礎。
隨著腸道菌群相關研究的增加,已產生了海量的宏基因組測序數據;同時,伴隨著機器學習算法的不斷革新,越來越多的方法和模型可供選擇。然而,由于領域內的研究隊列之間的獨立性以及地域性,研究者們難以對海量的腸道菌群宏基因組測序數據實現廣泛利用,并且由于涉及微生物和計算機科學兩領域之間的交叉,在對于腸道菌群的研究當中,對于機器學習方法的使用方面還存在著滯后,從而導致了當前對于腸道菌群與年齡關聯的研究中存在著預測方法準確度低、數據利用率低、特征存在冗余、模型算法單一以及受宿主背景因素影響等問題。
因此,如何實現利用機器學習方法來構建基于腸道菌群宏基因組測序數據的準確年齡預測模型進而解析關鍵腸道菌群生物標志物,尚缺少可靠的解決方法;而目前的基于腸道菌群的年齡預測方法單一模型,如套索算法、彈性網絡、貝葉斯嶺回歸、支持向量機、隨機森林、梯度提升回歸樹、XGBoost和LightGBM模型,均存在準確度低、數據利用率低、特征存在冗余、模型算法單一以及受宿主背景因素影響的缺點。
發明內容
[技術問題]
本發明的目的是為了解決當前的基于腸道菌群的年齡預測模型及預測方法準確度低、數據利用率低、特征存在冗余、模型算法單一以及受宿主背景因素影響的問題,而提出了一種基于腸道菌群預測模型集成學習的成年人年齡預測方法及其應用。
[技術方案]
本發明上述目的是通過以下技術方案實現的:
一種基于腸道菌群預測模型集成學習的成年人年齡預測方法,具體包括如下步驟:
步驟一:獲取不同年齡的成年人的腸道菌群數據樣本作為原始數據,同時收集與數據樣本相對應的宿主的背景信息,包括年齡以及地域特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江南大學,未經江南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111360059.8/2.html,轉載請聲明來源鉆瓜專利網。





