[發(fā)明專利]一種機(jī)器學(xué)習(xí)糖尿病發(fā)病風(fēng)險預(yù)測方法及應(yīng)用在審
| 申請?zhí)枺?/td> | 202110232859.5 | 申請日: | 2021-03-03 |
| 公開(公告)號: | CN112786204A | 公開(公告)日: | 2021-05-11 |
| 發(fā)明(設(shè)計)人: | 房中則;劉永哲;高小茜;王婉瑩;李欣 | 申請(專利權(quán))人: | 天津醫(yī)科大學(xué) |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/70;G16H15/00;G06K9/62 |
| 代理公司: | 天津市杰盈專利代理有限公司 12207 | 代理人: | 朱紅星 |
| 地址: | 300070 *** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機(jī)器 學(xué)習(xí) 糖尿病 發(fā)病 風(fēng)險 預(yù)測 方法 應(yīng)用 | ||
本發(fā)明提供一種機(jī)器學(xué)習(xí)糖尿病發(fā)病風(fēng)險預(yù)測方法。所述方法包括:數(shù)據(jù)獲取模塊:獲取代謝組學(xué)數(shù)據(jù);數(shù)據(jù)預(yù)處理模塊:對獲取的數(shù)據(jù)進(jìn)行預(yù)處理;機(jī)器學(xué)習(xí)模塊:以進(jìn)行糖尿病風(fēng)險預(yù)測為目的,基于機(jī)器學(xué)習(xí)算法和代謝組學(xué)數(shù)據(jù),構(gòu)建預(yù)測模型;顯示輸出模塊:對所得到的待預(yù)測樣本進(jìn)行測試,并輸出預(yù)測結(jié)果。預(yù)測結(jié)果為1表示有糖尿病患病風(fēng)險,當(dāng)結(jié)果為0表示沒有糖尿病患病風(fēng)險。應(yīng)用本發(fā)明實施例,基于隨機(jī)森林和支持向量機(jī)算法為主的技術(shù),結(jié)合代謝組學(xué)特征,構(gòu)建糖尿病風(fēng)險預(yù)測模型。可用于提高決策效率,指導(dǎo)非醫(yī)護(hù)人員進(jìn)行疾病風(fēng)險檢測或輔助臨床決策,實現(xiàn)疾病的三級預(yù)防和推動發(fā)展全民健康的目的。
技術(shù)領(lǐng)域
本發(fā)明屬于一種使用機(jī)器學(xué)習(xí)算法構(gòu)建模型并采用新型預(yù)測因子預(yù)測糖尿病發(fā)病風(fēng)險的方法。
背景技術(shù)
疾病風(fēng)險預(yù)測主要應(yīng)用于輔助臨床決策,輔助敏感性人群的健康檢測,用于非醫(yī)護(hù)人員檢測疾病風(fēng)險。
Ⅱ型糖尿病是內(nèi)分泌科常見的代謝性疾病,占糖尿病患者的90%以上。目前,糖尿病風(fēng)險的預(yù)測主要包括醫(yī)護(hù)人員根據(jù)專業(yè)知識判斷和使用傳統(tǒng)危險因素構(gòu)建的簡單預(yù)測模型兩種預(yù)測方式。通過醫(yī)務(wù)人員的經(jīng)驗和自我學(xué)習(xí)對疾病進(jìn)行判斷是目前臨床的主要手段,然而,醫(yī)務(wù)人員對疾病進(jìn)行判斷存在主觀差異性大,效率低等問題。基于傳統(tǒng)的風(fēng)險預(yù)測因子構(gòu)建的簡單預(yù)測模型,能夠在一定程度上提高疾病預(yù)測效率,但目前簡單預(yù)測模型的預(yù)測能力較低,敏感性和特異性較差,不能滿足臨床要求。傳統(tǒng)的風(fēng)險預(yù)測因子如性別、年齡、體質(zhì)指數(shù)、空腹血糖、糖化血紅蛋白、肌酐、總膽固醇、甘油三酸酯、高密度載脂蛋白膽固醇和低密度載脂蛋白膽固醇等,只能基于群體水平進(jìn)行風(fēng)險預(yù)測,不能提供個體水平的監(jiān)測,常常造成個體的防治過度或防治不充分。
發(fā)明內(nèi)容
本發(fā)明克服了醫(yī)護(hù)人員風(fēng)險預(yù)測的效率低,標(biāo)準(zhǔn)不統(tǒng)一,存在主觀差異,以及簡單預(yù)測模型的預(yù)測能力低,傳統(tǒng)預(yù)測因子構(gòu)建模型個體針對性差的問題。先進(jìn)的人工智能算法與傳統(tǒng)模型相比,在醫(yī)學(xué)數(shù)據(jù)處理方面更具優(yōu)越性。現(xiàn)實生活中,醫(yī)療信息繁多,傳統(tǒng)統(tǒng)計方法構(gòu)建的模型往往對數(shù)據(jù)的分布等存在要求,高維、非線性、交互作用等都使得傳統(tǒng)線性回歸模型不能很好地反映預(yù)測因子對疾病的預(yù)測能力。一項評估線性回歸模型與機(jī)器學(xué)習(xí)模型對心血管疾病、糖尿病等的分類情況的比較研究顯示,機(jī)器學(xué)習(xí)模型具有更高的準(zhǔn)確率。除模型的選擇外,基于疾病的多病因理論,本發(fā)明還使用了除傳統(tǒng)危險因素以外的具有個體特異性的預(yù)測因子。
本發(fā)明的目的是提高決策效率,指導(dǎo)非醫(yī)護(hù)人員進(jìn)行疾病風(fēng)險檢測或輔助臨床決策,實現(xiàn)疾病的三級預(yù)防和推動發(fā)展全民健康。為實現(xiàn)上述目的,本發(fā)明公開了如下的技術(shù)內(nèi)容:
1. 一種機(jī)器學(xué)習(xí)糖尿病發(fā)病風(fēng)險預(yù)測方法,其特征在于包括數(shù)據(jù)獲取模塊、數(shù)據(jù)預(yù)處理模塊、機(jī)器學(xué)習(xí)模塊和顯示輸出模塊,其中:
(1)數(shù)據(jù)獲取模塊連接醫(yī)院數(shù)據(jù)庫,用于獲取醫(yī)院數(shù)據(jù)庫中2型糖尿病患者的臨床病例數(shù)據(jù),每個臨床病例數(shù)據(jù)包括患者的代謝組學(xué)數(shù)據(jù)和對應(yīng)的臨床檢驗結(jié)果。
(2)數(shù)據(jù)預(yù)處理模塊的輸入端與數(shù)據(jù)獲取模塊的輸出端連接,進(jìn)行數(shù)據(jù)缺失值插補(bǔ)、抽樣、標(biāo)準(zhǔn)化和刪除近似零方差特征。使用隨機(jī)森林模型進(jìn)行數(shù)據(jù)缺失值插補(bǔ);使用bootstrap進(jìn)行數(shù)據(jù)抽樣,目的是使樣本數(shù)據(jù)中糖尿病患者和非糖尿病患者的數(shù)量相同;使用歸一化和離散化處理進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,目的是將患者代謝組學(xué)數(shù)據(jù)的度量單位和格式進(jìn)行統(tǒng)一;刪除近似零方差變量的目的是去除樣本數(shù)據(jù)中的不平衡變量以得到穩(wěn)定理想的模型。
(3)機(jī)器學(xué)習(xí)模塊的輸入端與數(shù)據(jù)預(yù)處理模塊的輸出端連接,該模塊的結(jié)構(gòu)如下:
① 數(shù)據(jù)集劃分:使用bootstrap將樣本數(shù)據(jù)重抽樣為訓(xùn)練集和測試集,劃分比例為2:1;
② 特征變量篩選:使用隨機(jī)森林進(jìn)行特征變量篩選;
③ 構(gòu)建隨機(jī)森林模型和支持向量機(jī)模型:根據(jù)篩選后的變量構(gòu)建隨機(jī)森林模型和支持向量機(jī)模型,使用N折交叉驗證重抽樣進(jìn)行參數(shù)調(diào)整,選擇最優(yōu)模型;
④ 內(nèi)部驗證:使用最優(yōu)隨機(jī)森林模型和支持向量機(jī)模型對測試集進(jìn)行內(nèi)部驗證。使用曲線下面積、假陽性率、假陰性率和準(zhǔn)確率評估模型的預(yù)測能力;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津醫(yī)科大學(xué),未經(jīng)天津醫(yī)科大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110232859.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 與PD發(fā)病相關(guān)的基因網(wǎng)絡(luò)通路分析模型的建立方法
- 病史記錄顯示系統(tǒng)及其方法
- 癌癥發(fā)病或癌癥發(fā)病風(fēng)險的判定方法
- 一種預(yù)防和治療羊痘的藥劑
- 一種土壤煙草黑脛病發(fā)病潛力的預(yù)測方法
- 一種檢測腦卒中發(fā)病風(fēng)險以及發(fā)病的生物標(biāo)志物的檢測方法及其應(yīng)用
- 一種健康評估方法、健康評估裝置及計算機(jī)可讀存儲介質(zhì)
- 一種疾病預(yù)警方法、疾病預(yù)警裝置及計算機(jī)可讀存儲介質(zhì)
- 一種智能診斷疾病的方法、裝置、系統(tǒng)及存儲介質(zhì)
- 一種院感監(jiān)控管理方法及系統(tǒng)





