[發(fā)明專利]基于stacking算法的妊娠糖尿病預(yù)測方法在審
| 申請?zhí)枺?/td> | 202010947618.4 | 申請日: | 2020-09-10 |
| 公開(公告)號: | CN112185555A | 公開(公告)日: | 2021-01-05 |
| 發(fā)明(設(shè)計)人: | 高瑪娜 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/70 |
| 代理公司: | 濟南佰智蔚然知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 37285 | 代理人: | 王硯雷 |
| 地址: | 100020 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 stacking 算法 妊娠 糖尿病 預(yù)測 方法 | ||
1.基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于,所述包括以下步驟:
S1、患病數(shù)據(jù)收集;
S2、數(shù)據(jù)處理;
S3、特征分析與特征構(gòu)造;
S4、構(gòu)造最優(yōu)子集;
S5、單集成預(yù)測模型構(gòu)建;
S6、模型融合;
S7、融合模型與單模型預(yù)測性能分析與對比。
2.根據(jù)權(quán)利要求1所述的基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于:所述步驟S1、患病數(shù)據(jù)收集中,收集便攜式計算機,通過便攜式計算機登錄阿里云醫(yī)療數(shù)據(jù)庫,收集阿里云醫(yī)療真實數(shù)據(jù),記錄患病數(shù)據(jù)備份。
3.根據(jù)權(quán)利要求1所述的基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于:所述步驟S2、數(shù)據(jù)處理中,選用合適的數(shù)據(jù)預(yù)處理方法處理缺失值,處理和選擇特征來構(gòu)成特征子集,使構(gòu)成的特征子集能在算法上表現(xiàn)更好的效果,以及構(gòu)造有效的特征子集,選出對妊娠糖尿病有影響的特征變量作為模型的輸入變量,使計算的復(fù)雜度簡化并提升模型的預(yù)測效果。
4.根據(jù)權(quán)利要求1所述的基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于:所述步驟S3、特征分析與特征構(gòu)造中,分別對比步驟S2、數(shù)據(jù)處理中異常值處理和缺失值處理,對數(shù)據(jù)進行數(shù)據(jù)處理及分析。
5.根據(jù)權(quán)利要求1所述的基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于:所述步驟S4、構(gòu)造最優(yōu)子集中,選取S3、特征分析與特征構(gòu)造中,最優(yōu)數(shù)據(jù)構(gòu)建子集。
6.根據(jù)權(quán)利要求1所述的基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于:所述步驟S5、單集成預(yù)測模型構(gòu)建中,用集成學(xué)習(xí)算法構(gòu)建預(yù)測模型來預(yù)測妊娠糖尿病,以及根據(jù)數(shù)據(jù)集特點對模型參數(shù)進行調(diào)優(yōu),分別建立XGBoost、隨機森林、catboost、邏輯回歸四個單集成妊娠糖尿病預(yù)測模型,并通過實驗調(diào)參使單集成模型的預(yù)測效果達到最佳。
7.根據(jù)權(quán)利要求1所述的基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于:所述步驟S6、模型融合中,結(jié)合步驟S5、單集成預(yù)測模型構(gòu)建中XGBoost、隨機森林、catboost、邏輯回歸四者的優(yōu)點,彌補不足,選擇兩層stacking集成學(xué)習(xí)框架進行模型融合,選取XGBoost、隨機森林與catboost這三種模型當(dāng)做模型融合的基模型作為訓(xùn)練,并得出預(yù)測結(jié)果,將預(yù)測結(jié)果作為特征,應(yīng)用到邏輯回歸模型中進行訓(xùn)練,訓(xùn)練出最終預(yù)測模型。
8.根據(jù)權(quán)利要求1所述的基于stacking算法的妊娠糖尿病預(yù)測方法,其特征在于:所述步驟S7、融合模型與單模型預(yù)測性能分析與對比中,將步驟S6、模型融合中的預(yù)測結(jié)果與步驟S5、單集成預(yù)測模型構(gòu)建中四種單集成預(yù)測模型預(yù)測結(jié)果進行匯總,對AUC值進行比較,驗證融合模型的預(yù)測表現(xiàn)是否優(yōu)于其他模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010947618.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種空調(diào)過濾裝置
- 下一篇:一種服務(wù)器的散熱器
- 基于stacking集成學(xué)習(xí)算法的時空數(shù)據(jù)預(yù)測方法
- 基于stacking集成學(xué)習(xí)算法的時空數(shù)據(jù)預(yù)測建模方法
- 一種特征集獲取方法、裝置、計算機設(shè)備及介質(zhì)
- 基于Stacking集成框架的光譜特征變量選擇與優(yōu)化方法
- 一種基于改進的Stacking模型的車輛尾氣濃度估計方法
- 房價預(yù)測方法及計算機可讀存儲介質(zhì)
- 一種短期光伏發(fā)電功率預(yù)測的方法
- 基于特征集融合的語音情感識別及評價方法
- 一種基于Stacking模型融合的樓宇用電量預(yù)測方法和系統(tǒng)
- 一種基于大數(shù)據(jù)的自動化文本分類標注系統(tǒng)的設(shè)計方法、優(yōu)化方法及標注方法





