[發(fā)明專利]基于LSTM的新冠肺炎疫情群體態(tài)勢預(yù)測方法有效
| 申請?zhí)枺?/td> | 202010657929.7 | 申請日: | 2020-07-09 |
| 公開(公告)號: | CN111798991B | 公開(公告)日: | 2022-09-02 |
| 發(fā)明(設(shè)計)人: | 張學(xué)旺;李洋洋;黃勝;崔一輝;馮家琦;林金朝 | 申請(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號: | G16H50/80 | 分類號: | G16H50/80;G06N3/04;G06N3/08 |
| 代理公司: | 北京同恒源知識產(chǎn)權(quán)代理有限公司 11275 | 代理人: | 楊柳岸 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 lstm 肺炎 疫情 群體 態(tài)勢 預(yù)測 方法 | ||
1.基于LSTM的新冠肺炎疫情群體態(tài)勢預(yù)測方法,其特征在于:該方法包括以下步驟:
S1:新冠肺炎疫情數(shù)據(jù)獲取;
S2:全國新冠肺炎疫情群體態(tài)勢預(yù)測;
S3:省、自治區(qū)和直轄市新冠肺炎疫情預(yù)測;
S4:城市新冠肺炎疫情群體態(tài)勢預(yù)測;
所述S1具體為:
S11:從搜索平臺新冠肺炎疫情大數(shù)據(jù)平臺獲取源代碼;
S12:利用Python集成開發(fā)環(huán)境Pycharm,利用Python爬蟲庫requests、urllib以及JSON模塊、lxml模塊中的etree函數(shù),通過編程語句xpath('//script[@type=application/json]/text()')獲取搜索平臺新冠肺炎疫情大數(shù)據(jù)平臺源代碼JSON格式文件,并篩選出中國的新冠肺炎疫情數(shù)據(jù);
S13:將全國新冠肺炎疫情數(shù)據(jù)按新增確診病例數(shù)據(jù)、新增境外輸入病例、新增無癥狀感染者病例、新增重癥病例、新增死亡病例、新增治愈病例和新增疑似病例數(shù)據(jù)和時間生成csv格式的文件并保存在本地主機;
所述S2具體為:
獲取全國新冠肺炎疫情數(shù)據(jù)后,需要構(gòu)建LSTM網(wǎng)絡(luò)和對數(shù)據(jù)進行預(yù)處理和歸一化處理,使輸入數(shù)據(jù)符合LSTM網(wǎng)絡(luò)的輸入格式;
S21:將生成的csv格式的新冠肺炎疫情數(shù)據(jù)按n_lag天的數(shù)據(jù)構(gòu)成數(shù)組作為輸入數(shù)據(jù),將之后28天的數(shù)據(jù)構(gòu)成數(shù)組作為預(yù)測標(biāo)簽,形成預(yù)測數(shù)據(jù)集;
S22:將預(yù)測數(shù)據(jù)集按7:3比例劃分為訓(xùn)練集和測試集;
S23:將輸入數(shù)據(jù)進行歸一化處理,將輸入數(shù)據(jù)x映射x′到[0,1]之間;選取最大值max和最小值min,采用公式(7)進行歸一化處理;
S24:構(gòu)建LSTM模型,通過人工神經(jīng)網(wǎng)絡(luò)庫Keras,利用Keras中包含的LSTM網(wǎng)絡(luò)模塊以及損失函數(shù)、層數(shù)和Dropout模塊,將訓(xùn)練集數(shù)據(jù)輸入到LSTM網(wǎng)絡(luò)中進行訓(xùn)練,損失函數(shù)選取均方誤差函數(shù)MSE,優(yōu)化器選取Adam,通過設(shè)置迭代次數(shù)epoch、批處理大小batch_size以及時間步長n_lag,不斷優(yōu)化LSTM網(wǎng)絡(luò),并使損失函數(shù)降到最低;
S25:將測試集數(shù)據(jù)送入到訓(xùn)練好的LSTM網(wǎng)絡(luò)中,采用公式(8)均方根誤差RMSE來評價真實值與預(yù)測值之間的偏差,并且根據(jù)測試集得出的RMSE值繼續(xù)調(diào)整LSTM網(wǎng)絡(luò)訓(xùn)練參數(shù),通過增加迭代次數(shù)、修改時間步長n_lag使測試集RMSE值降到最低時,認定此時訓(xùn)練模型已是最優(yōu),然后保存模型參數(shù);
S26:預(yù)測;將訓(xùn)練好的網(wǎng)絡(luò)參數(shù)保存,將所要預(yù)測的時間的數(shù)據(jù)和時間步長n_lag的數(shù)據(jù)生成序列,并調(diào)整維度,然后輸入到已訓(xùn)練好LSTM網(wǎng)絡(luò)中,得出全國28天后的新冠肺炎疫情群體態(tài)勢;
S27:重復(fù)以上步驟,對全國新增確診病例數(shù)據(jù)、新增境外輸入病例、新增無癥狀感染者病例、新增重癥病例、新增死亡病例、新增治愈病例和新增疑似病例數(shù)據(jù)分別進行LSTM網(wǎng)絡(luò)訓(xùn)練參數(shù),得出不同病例的預(yù)測模型、參數(shù)和預(yù)測結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010657929.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于高階長短期記憶網(wǎng)絡(luò)的系統(tǒng)和方法
- 基于深度學(xué)習(xí)LSTM的空調(diào)故障診斷方法
- 基于注意力機制的時間序列預(yù)測方法、裝置及存儲介質(zhì)
- 一種基于PCA-LSTM網(wǎng)絡(luò)的廢水處理智能監(jiān)控方法
- 一種基于FAF-LSTM深度神經(jīng)網(wǎng)絡(luò)的居民負荷預(yù)測方法及系統(tǒng)
- 用于預(yù)測血糖水平的循環(huán)神經(jīng)網(wǎng)絡(luò)裝置和系統(tǒng)
- 基于情景LSTM結(jié)構(gòu)網(wǎng)絡(luò)的微博情感分析方法
- 語音信號處理方法、裝置、電子設(shè)備和存儲介質(zhì)
- 基于約束并行LSTM分位數(shù)回歸的電力負荷概率預(yù)測方法
- 基于深度網(wǎng)絡(luò)AS-LSTM的命名實體識別系統(tǒng)及識別方法





