[發明專利]基于集成模型的膿毒癥死亡率預測系統有效
| 申請號: | 201810758910.4 | 申請日: | 2018-07-11 |
| 公開(公告)號: | CN109119167B | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 王紅;劉海燕;王露潼;房有麗;狄瑞彤;周瑩;王倩;宋永強;張偉;胡斌 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16H50/30;G06K9/62 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250014 山東省濟*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 集成 模型 膿毒癥 死亡率 預測 系統 | ||
1.基于集成模型的膿毒癥死亡率預測系統,其特征是,包括:
輸入器,用于獲取被測者膿毒癥相關檢測項目的測量值;
處理器,與輸入器相連,所述處理器用于對輸入器獲取的數據進行處理,輸出膿毒癥死亡率的預測值;所述處理器,包括:數據預處理模塊、多維特征選擇模塊、集成模型構建模塊和集成模型預測模塊;
所述數據預處理模塊,用于對被測者膿毒癥相關檢測項目測量值的噪聲數據或缺失數據進行清洗,對清洗后的數據進行數據轉換和歸一化處理;
所述多維特征選擇模塊,用于建立與被測者膿毒癥相關檢測項目測量值相對應特征項,將特征項作為第一樣本,通過基于改進的隨機森林算法對所述第一樣本進行特征選擇,得到被測者膿毒癥相關檢測項目測量值的若干個主特征子集,將若干個主特征子集構成的樣本集合作為第二樣本;
所述集成模型構建模塊,對隨機森林、梯度提升樹GBDT和邏輯回歸三個基分類器,采用加權投票融合的方法,構建集成模型;
改進的隨機森林算法的具體步驟為:
步驟(1):采用10折交叉驗證的方法,計算欠采樣后得到的平衡數據集中每個特征的重要性;
步驟(2):根據決策樹所做的貢獻來決定權重,基于多棵決策樹的判定結果對一致性高的決策樹分配高的權重;
步驟(3):用每個特征重要性乘以每個決策樹的權重,再將乘積結果求平均即獲得最終的特征重要性度量值;對最終的特征重要性度量值從高到低進行排序,獲取排序靠前的設定個特征作為最終分類的主特征子集;
所述步驟(1)的具體步驟為:
每個特征重要性度量值FIij的計算公式如下:
其中,i代表第i個平衡數據集,j代表第j個特征,k代表第k層數據,第j個特征的特征重要性度量是由ACC和ACCFj的差值決定的,ACC代表擾動屬性值前的分類準確率,ACCFj代表擾動第j個屬性值后的分類準確率;ACCik表示第i個平衡數據集第k層數據擾動屬性值前的分類準確率,ACCFijk表示第i個平衡數據集第k層數據擾動第j個屬性值前的分類準確率;
所述步驟(2)的具體步驟為:
在S條記錄的測試數據集中,第i棵樹的權重Wi:
其中Tij表示第i棵樹對第j個實例的預測結果,Ej表示對第j個實例的集成預測結果,ACCE表示集成預測的準確率;
所述步驟(3)的具體步驟為:
通過每棵決策樹確定所有特征的重要性度量值以后,乘以各樹的權重,求平均即獲得最終的特征重要性度量值FinalFIj,對最終的特征重要性度量值從高到低進行排序,獲取排序靠前的設定個特征作為最終分類的特征子集;
加權融合公式為:
其中,wt(x)是模型ht(x)的權重,wt(x)≥0,權重由交叉驗證得到的準確率決定;
所述集成模型預測模塊,將第二樣本隨機分為訓練集和預測集,利用訓練集對集成模型進行訓練,然后利用預測集對訓練好的集成模型進行測試,輸出膿毒癥死亡率預測值。
2.如權利要求1所述的基于集成模型的膿毒癥死亡率預測系統,其特征是,所述膿毒癥相關檢測項目,包括:ICU停留ID、患者ID、住院ID、性別、入院時間、出院時間、年齡、種族、首次ICU類型、是否在入院時死亡、是否在入院30天內死亡、吸入氧氣濃度、血氧飽和度、序貫器官衰竭評分、全身炎癥反應綜合評分、膿毒癥確診時間、乳酸清除率、用藥時間、是否進行機械通氣、治療開始時間或治療結束時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810758910.4/1.html,轉載請聲明來源鉆瓜專利網。





