[發明專利]一種基于機器學習預測中暑發生的模型及方法有效
| 申請號: | 201811183627.X | 申請日: | 2018-10-11 |
| 公開(公告)號: | CN109359770B | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 李湉湉;王彥文;杜艷君;王情 | 申請(專利權)人: | 中國疾病預防控制中心環境與健康相關產品安全所 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04 |
| 代理公司: | 廣州高炬知識產權代理有限公司 44376 | 代理人: | 孫明科 |
| 地址: | 100021 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 預測 中暑 發生 模型 方法 | ||
本發明公開一種基于機器學習預測中暑發生的模型及方法,步驟一:建立典型高溫城市的高溫事件發生數據庫;步驟二:對數據庫進行數據匹配及清理;步驟三:應用Boruta算法進行變量篩選;步驟四:建立隨機森林模型的訓練數據集及驗證數據集;步驟五:確定隨機森林參數并建立隨機森林模型;步驟六:變量重要性排序;步驟七:模型預測結果評估;步驟八:應用Bland?Altman一致性評價方法對模型結果進行評估。本發明方法更能代表高溫熱浪事件的不良健康效應;能夠較好的擬合非線性關系變量,提高模型擬合的效果;較為全面的對中暑事件的發生進行預測;能夠較好的減少人群健康損傷,降低人群健康相關的經濟損失。
技術領域
本發明涉及一種基于機器學習預測中暑發生的模型及方法,包含基于隨機森林方法的模型建立以及其模型擬合效果的評估,尤其是一種預測不同地區日均中暑發生例數的模型及方法,基于不同地區的氣象以及社會經濟學等參數,結合機器學習方法建立預測模型,評估未來日均中暑發生例數,屬于機器學習應用于高溫健康危害的智能預測的技術領域。
背景技術
近年來,全球范圍內的熱浪事件形勢嚴峻。根據聯合國政府間氣候變化專門委員會發布的報告,過去半個世紀中熱浪的發生頻率呈增加趨勢,提示未來幾十年中,地表溫度將持續增加并伴隨極端高溫事件頻發,其帶來的嚴峻的不良健康效應更是不容忽視。因此,對于熱浪及其相關的健康后果的有效預估可以更好的提升人群健康防護,同時減少熱浪相關的健康損失。其中,中暑則是熱浪事件對應的重要不良健康結局。中暑事件一般發生在機體處于高溫、高濕等極端環境中,從而產生身體溫度的異常升高。但由于中暑事件報道具有時間延遲性,相關變量具有潛在共線性,這些可能的因素都會影響中暑發生預測的效率。
現有的相關預測模型在可靠性等方面尚存在不足之處,并且缺乏基于實際數據的對應評估。并且,現有的對于極端炎熱天氣以及其相應不良健康結局的預測模型大多基于氣象觀測數據,如溫度、相對濕度等,但是分析中缺乏社會經濟學因素的加入,因而可能帶來對于健康效應具有重要影響的指標貢獻的缺失。大部分已建立的健康預測系統將死亡率作為健康終點,少數研究將入院率等指標作為健康終點。因此,這些預測模型的代表性受到限制,并且缺乏實際數據以驗證模型的有效性。
因此,在我國構建基于多城市的中暑事件發生預測模型并應用于高溫中暑事件發生的預測預警是十分必要的。
發明內容
本發明的目的是提供一種基于機器學習預測中暑發生的模型及方法,以解決現有相關預測模型在可靠性較差,及缺乏基于實際數據的對應評估等方面存在的不足;以構建基于多城市的中暑事件發生預測模型并應用于高溫中暑事件發生的預測預警。
本發明一種基于機器學習預測中暑發生的模型,
本發明一種基于機器學習預測中暑發生的模型及方法,包含基于隨機森林方法的模型建立以及其模型擬合效果的評估。具體步驟如下,
步驟一:建立典型高溫城市的高溫事件發生數據庫
整理中國典型城市的經濟學及社會學指標,同時整理歷年高溫時段的氣象因素以及中暑數據,建立我國典型城市的中暑事件數據庫。
步驟二:對數據庫進行數據匹配及清理
將步驟一建立的中暑事件數據庫,進行清理和剔除,得到匹配數據庫,具體為:以日均中暑事件發生數量為標準,以前一日、前三日、前五年的溫度、濕度等氣象因素數據以及社會經濟學數據(所有數據項詳見表1)為變量,建立匹配數據庫。根據《防暑降溫措施管理辦法》,35℃以上天氣定義為高溫天氣,因此剔除35℃以下的非高溫天氣對應數據,保證模型建立的代表性和可靠性。同時為保證隨機森林建立的有效性,對缺失數據進行剔除。
步驟三:應用Boruta算法進行變量篩選
采用Boruta特征選擇算法,根據特征即各變量重要性判斷特征變化后的平均減少精度,以評價每個特征即變量的重要性,迭代逐步刪除非重要的特征,最后給出接受或拒絕特征變量的結果,達到模型變量篩選的目的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國疾病預防控制中心環境與健康相關產品安全所,未經中國疾病預防控制中心環境與健康相關產品安全所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811183627.X/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





