[發明專利]基于stacking算法的妊娠糖尿病預測方法在審
| 申請號: | 202010947618.4 | 申請日: | 2020-09-10 |
| 公開(公告)號: | CN112185555A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 高瑪娜 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/70 |
| 代理公司: | 濟南佰智蔚然知識產權代理事務所(普通合伙) 37285 | 代理人: | 王硯雷 |
| 地址: | 100020 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 stacking 算法 妊娠 糖尿病 預測 方法 | ||
本發明公開了基于stacking算法的妊娠糖尿病預測方法,涉及妊娠糖尿病預測技術領域,具體為基于stacking算法的妊娠糖尿病預測方法,包括以下步驟:S1、患病數據收集;S2、數據處理;S3、特征分析與特征構造;S4、構造最優子集;S5、單集成預測模型構建;S6、模型融合;S7、融合模型與單模型預測性能分析與對比。該基于stacking算法的妊娠糖尿病預測方法基于集成學習建立一個有效的妊娠糖尿病預測糖尿病患病風險的模型,幫助醫護人員預測處于妊娠糖尿病的患者,及時并準確的對高危人群采取針對性的措施,這將有助于妊娠期糖尿病的輔助診斷和預防,為智能診斷和減少不良妊娠作出貢獻。
技術領域
本發明涉及妊娠糖尿病預測技術領域,具體為基于stacking算法的妊娠糖尿病預測方法。
背景技術
妊娠期糖尿病是導致二型糖尿病及其綜合癥蔓延全球的重要原因之一,根據研究表明,截止2019年我國患有妊娠期糖尿病的人數排名世界第二。妊娠期糖尿病(GDM)指的是孕婦在妊娠期表現的糖代謝異常,此類型的糖尿病是由于妊娠導致的暫時性病癥,會影響到孕婦和胎兒的人身安全。妊娠期糖尿病患者容易患有高血壓,原因是人體內的胰島素分泌不足,血糖含量過高,從而影響到血管的彈性。除此之外,高濃度的血糖會促進孕婦分泌的羊水增加,并刺激到子宮內膜,容易使胎兒早產和窒息。高血糖還會影響到免疫系統,影響白細胞的吞噬能力,導致免疫能力下降,進而發生胎盤早剝的情況,目前的研究發現妊娠期糖尿病是導致孕婦不正常妊娠的原因之一,包括胎兒巨大癥、胎兒肩難產。妊娠期糖尿病的影響不止于此,GDM會對母體和胎兒帶來長期影響,有研究結果說明,患有GDM的孕婦在產后五年內,有13%-63%的概率患有二型糖尿病且糖耐量異常。
近年來,機器學習算法在醫療領域的應用頻率和研究深度增長迅速,已經有學者應用機器學習算法實現對部分疾病患病率的預測,且效果顯著,集成學習是機器學習算法中較有特點的一類,它是按照將弱分類器集成為強分類器的思路來組合基礎模型,集成學習模型除了在穩定性和泛化能力上相比傳統模型表現突出,在最終的預測準確率上也相對較高。
疾病預測在根據真實數據建模的過程中,往往會遇到數據質量差、缺失值較多、正負樣本有偏等問題,在數據預處理過程中,選擇怎樣的處理方式將使預測精度最高的問題;使用stacking集成學習框架并加以改進,以解決樣本標簽不足可能會產生的過擬合問題,并使融合后的模型較單模型性能表現更好的缺點。
發明內容
針對現有技術的不足,本發明提供了基于stacking算法的妊娠糖尿病預測方法,解決了上述背景技術中提出疾病預測在根據真實數據建模的過程中,往往會遇到數據質量差、缺失值較多、正負樣本有偏等問題,在數據預處理過程中,選擇怎樣的處理方式將使預測精度最高的問題;使用stacking集成學習框架并加以改進,以解決樣本標簽不足可能會產生的過擬合問題,并使融合后的模型較單模型性能表現更好的問題。
為實現以上目的,本發明通過以下技術方案予以實現:基于stacking算法的妊娠糖尿病預測方法,包括以下步驟:
S1、患病數據收集;
S2、數據處理;
S3、特征分析與特征構造;
S4、構造最優子集;
S5、單集成預測模型構建;
S6、模型融合;
S7、融合模型與單模型預測性能分析與對比。
可選的,所述步驟S1、患病數據收集中,收集便攜式計算機,通過便攜式計算機登錄阿里云醫療數據庫,收集阿里云醫療真實數據,記錄患病數據備份。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010947618.4/2.html,轉載請聲明來源鉆瓜專利網。





