[發(fā)明專利]一種基于深度學(xué)習(xí)的多尺度空氣質(zhì)量預(yù)報(bào)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010111029.2 | 申請(qǐng)日: | 2020-02-24 |
| 公開(公告)號(hào): | CN111339092B | 公開(公告)日: | 2023-09-08 |
| 發(fā)明(設(shè)計(jì))人: | 徐愛蘭;張?jiān)俜?/a>;孫強(qiáng) | 申請(qǐng)(專利權(quán))人: | 江蘇省南通環(huán)境監(jiān)測(cè)中心;南通大學(xué) |
| 主分類號(hào): | G06F18/25 | 分類號(hào): | G06F18/25;G06N3/0442;G06N3/045;G06N3/0464;G06N3/048;G06N3/09;G06F16/2458;G01N33/00;G01W1/10 |
| 代理公司: | 南京同澤專利事務(wù)所(特殊普通合伙) 32245 | 代理人: | 蔡晶晶 |
| 地址: | 226000 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 尺度 空氣質(zhì)量 預(yù)報(bào) 方法 | ||
1.一種基于深度學(xué)習(xí)的多尺度空氣質(zhì)量預(yù)報(bào)方法,其特征在于包括以下步驟:
步驟1、獲取實(shí)時(shí)更新的多源融合數(shù)據(jù)集并進(jìn)行歸一化處理,所述多源融合數(shù)據(jù)集包括各個(gè)空氣質(zhì)量監(jiān)測(cè)站點(diǎn)的各污染物實(shí)時(shí)數(shù)據(jù)和以及各個(gè)氣象站點(diǎn)的各氣象實(shí)時(shí)數(shù)據(jù);各污染物實(shí)時(shí)數(shù)據(jù)包括:PM2.5、PM10、NO2、CO、SO2、O3空氣污染物的濃度,氣象實(shí)時(shí)數(shù)據(jù)包括:降水量、風(fēng)速、風(fēng)向、氣壓、氣溫、污染源情況、AQI數(shù)據(jù)、氣象站與監(jiān)測(cè)站拓?fù)湮恢茫嘣慈诤蠑?shù)據(jù)集從各個(gè)監(jiān)測(cè)站點(diǎn)實(shí)時(shí)更新獲得,并通過數(shù)據(jù)庫(kù)模塊進(jìn)行保存;
步驟2、依據(jù)預(yù)報(bào)時(shí)間尺度將多源融合數(shù)據(jù)集進(jìn)行劃分為大尺度數(shù)據(jù)集和小尺度數(shù)據(jù)集;
步驟3、若用戶選擇大尺度預(yù)報(bào),則利用大尺度預(yù)報(bào)模型對(duì)大尺度數(shù)據(jù)集進(jìn)行處理得到大尺度預(yù)報(bào)數(shù)據(jù);若用戶選擇小尺度預(yù)報(bào),則利用小尺度預(yù)報(bào)模型對(duì)小尺度數(shù)據(jù)集進(jìn)行處理得到小尺度預(yù)報(bào)數(shù)據(jù),然后對(duì)經(jīng)過模型運(yùn)算的預(yù)報(bào)數(shù)據(jù)進(jìn)行反歸一化處理,得到預(yù)報(bào)結(jié)果;
本步驟中,大尺度預(yù)報(bào)模型和小尺度預(yù)報(bào)模型均使用HDAQF模型作為空氣質(zhì)量預(yù)報(bào)的訓(xùn)練模型;使用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)多源歷史數(shù)據(jù)進(jìn)行一維卷積運(yùn)算,挖掘數(shù)據(jù)內(nèi)在的深層關(guān)聯(lián)以及時(shí)空相關(guān)性,提取最有效的參數(shù)特征,利用雙向長(zhǎng)短時(shí)記憶模型對(duì)參數(shù)特征進(jìn)行預(yù)報(bào),最后使用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)預(yù)報(bào)的參數(shù)特征進(jìn)行綜合分析,得到預(yù)報(bào)結(jié)果;
所述HDAQF模型包含有CNN、LSTM和DNN,其中,CNN用于對(duì)時(shí)間序列的歷史數(shù)據(jù)進(jìn)行數(shù)值特征提取,LSTM用于對(duì)CNN提取得到的特征進(jìn)行更深層次的時(shí)間特征提取,給出預(yù)報(bào)空氣質(zhì)量的特征結(jié)果,DNN用于對(duì)LSTM給出的空氣質(zhì)量預(yù)報(bào)特征進(jìn)行計(jì)算,給出空氣質(zhì)量的數(shù)值預(yù)報(bào)結(jié)果;所述DNN中,第一層和第二層神經(jīng)網(wǎng)絡(luò)加入Dropout正則化層,設(shè)置dropout比率為0.3,第三層作為預(yù)報(bào)結(jié)果的輸出層;所述大尺度預(yù)報(bào)模型根據(jù)大尺度歷史數(shù)據(jù)集訓(xùn)練獲得,所述小尺度預(yù)報(bào)模型根據(jù)小尺度歷史數(shù)據(jù)集訓(xùn)練獲得;
HDAQF模型的訓(xùn)練循環(huán)次數(shù)為50-100次,每次訓(xùn)練的批處理量為32;CNN為兩層一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),每一層使用64個(gè)卷積核,卷積核的長(zhǎng)度為1,使用Relu作為激活函數(shù);LSTM選用兩層雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu),每一層的神經(jīng)元數(shù)量為128,使用tanh作為激活函數(shù);DNN為三層全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),第一層、第二層的神經(jīng)元數(shù)量均為256,使用linear作為激活函數(shù),第一層和第二層神經(jīng)網(wǎng)絡(luò)加入Dropout正則化層,設(shè)置dropout比率為0.3,第三層作為預(yù)報(bào)結(jié)果的輸出層,神經(jīng)元數(shù)量為1,使用linear作為激活函數(shù);
對(duì)于多尺度預(yù)報(bào)而言,需要針對(duì)不同尺度訓(xùn)練擬合出對(duì)應(yīng)尺度的深度學(xué)習(xí)模型,對(duì)應(yīng)預(yù)報(bào)精度為一小時(shí)的小尺度預(yù)報(bào)需求,需要對(duì)時(shí)間間隔為一小時(shí)的多源歷史數(shù)據(jù)集進(jìn)行訓(xùn)練與擬合;對(duì)應(yīng)預(yù)報(bào)精度為一天的大尺度預(yù)報(bào)需求,在完成小尺度深度學(xué)習(xí)模型的擬合后,通過使用遷移學(xué)習(xí)的方法,固定小尺度模型中的第一層卷積神經(jīng)網(wǎng)絡(luò)參數(shù),第一層雙向長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)參數(shù)以及第一層深度神經(jīng)網(wǎng)絡(luò)參數(shù),包括但不限于神經(jīng)網(wǎng)絡(luò)的單元數(shù)量、神經(jīng)元之間連接的權(quán)重以及偏置項(xiàng),再對(duì)時(shí)間間隔為一天的多源歷史數(shù)據(jù)集進(jìn)行訓(xùn)練與擬合,得到大尺度深度學(xué)習(xí)模型。
2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多尺度空氣質(zhì)量預(yù)報(bào)方法,其特征在于:所述HDAQF模型以Tensorflow作為深度學(xué)習(xí)框架。
3.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多尺度空氣質(zhì)量預(yù)報(bào)方法,其特征在于:將歷史多源融合數(shù)據(jù)集歸一化后進(jìn)行時(shí)間序列建模,用于訓(xùn)練HDAQF模型。
4.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多尺度空氣質(zhì)量預(yù)報(bào)方法,其特征在于:對(duì)于HDAQF模型,其訓(xùn)練階段的損失函數(shù)如下:
其中,MSE為均方誤差,i為時(shí)間序號(hào),oi為第i時(shí)刻目標(biāo)污染物的真實(shí)數(shù)值,pi為第i時(shí)刻目標(biāo)污染物的預(yù)報(bào)數(shù)值,n為總時(shí)長(zhǎng)。
5.一種基于深度學(xué)習(xí)的多尺度空氣質(zhì)量預(yù)報(bào)系統(tǒng),其特征在于包含:
客戶端,用于將預(yù)報(bào)需求傳遞至深度學(xué)習(xí)服務(wù)器和從深度學(xué)習(xí)服務(wù)器獲取預(yù)報(bào)結(jié)果并顯示,所述預(yù)報(bào)需求包含所要預(yù)報(bào)的地區(qū)、預(yù)報(bào)時(shí)長(zhǎng)和預(yù)報(bào)精度,所述客戶端為移動(dòng)端、電腦端或空氣質(zhì)量預(yù)報(bào)站點(diǎn);
深度學(xué)習(xí)服務(wù)器,包含有多源歷史數(shù)據(jù)融合模塊、深度學(xué)習(xí)模塊和數(shù)據(jù)庫(kù)模塊;
所述多源歷史數(shù)據(jù)融合模塊用于對(duì)多源歷史氣象和空氣質(zhì)量數(shù)據(jù)進(jìn)行融合,并制作成深度學(xué)習(xí)模塊所需的數(shù)據(jù)集,其中,多源歷史氣象數(shù)據(jù)和空氣質(zhì)量數(shù)據(jù)從各個(gè)監(jiān)測(cè)站點(diǎn)實(shí)時(shí)更新獲得,并通過數(shù)據(jù)庫(kù)模塊進(jìn)行保存;空氣質(zhì)量數(shù)據(jù)包括PM2.5、PM10、NO2、CO、SO2、O3空氣污染物的濃度,氣象數(shù)據(jù)包括降水量、風(fēng)速、風(fēng)向、氣壓、氣溫、污染源情況、AQI數(shù)據(jù)、氣象站與監(jiān)測(cè)站拓?fù)湮恢茫?/p>
所述深度學(xué)習(xí)模塊,選擇Tensorflow作為深度學(xué)習(xí)框架,使用HDAQF模型作為空氣質(zhì)量預(yù)報(bào)的訓(xùn)練模型;HDAQF模型包含有CNN、LSTM和DNN,其中,CNN用于對(duì)時(shí)間序列的歷史數(shù)據(jù)進(jìn)行數(shù)值特征提取,LSTM用于對(duì)CNN提取得到的特征進(jìn)行更深層次的時(shí)間特征提取,給出預(yù)報(bào)空氣質(zhì)量的特征結(jié)果,DNN用于對(duì)LSTM給出的空氣質(zhì)量預(yù)報(bào)特征進(jìn)行計(jì)算,給出空氣質(zhì)量預(yù)的數(shù)值預(yù)報(bào)結(jié)果;并且所述DNN中加入有Dropout層;DNN中,第一層和第二層神經(jīng)網(wǎng)絡(luò)加入Dropout正則化層,設(shè)置dropout比率為0.3,第三層作為預(yù)報(bào)結(jié)果的輸出層;主要參數(shù)設(shè)定如下:設(shè)定循環(huán)次數(shù)epoch為50,批處理量batch_size為32,卷積神經(jīng)網(wǎng)絡(luò)為兩層一維卷積結(jié)構(gòu),每一層使用64個(gè)卷積核,卷積核的長(zhǎng)度為1,使用Relu作為激活函數(shù);長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)為兩層雙向長(zhǎng)短時(shí)記憶模型,每一層的神經(jīng)元數(shù)量為128,使用tanh作為激活函數(shù);深度神經(jīng)網(wǎng)絡(luò)為三層全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),第一層、第二層的神經(jīng)元數(shù)量均為256,使用linear作為激活函數(shù),第三層作為預(yù)報(bào)結(jié)果的輸出層,神經(jīng)元數(shù)量為1,使用linear作為激活函數(shù);對(duì)于多尺度預(yù)報(bào)而言,需要針對(duì)不同尺度訓(xùn)練擬合出對(duì)應(yīng)尺度的深度學(xué)習(xí)模型,對(duì)應(yīng)預(yù)報(bào)精度為一小時(shí)的小尺度預(yù)報(bào)需求,需要對(duì)時(shí)間間隔為一小時(shí)的多源歷史數(shù)據(jù)集進(jìn)行訓(xùn)練與擬合;對(duì)應(yīng)預(yù)報(bào)精度為一天的大尺度預(yù)報(bào)需求,在完成小尺度深度學(xué)習(xí)模型的擬合后,通過使用遷移學(xué)習(xí)的方法,固定小尺度模型中的第一層卷積神經(jīng)網(wǎng)絡(luò)參數(shù),第一層雙向長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)參數(shù)以及第一層深度神經(jīng)網(wǎng)絡(luò)參數(shù),包括但不限于神經(jīng)網(wǎng)絡(luò)的單元數(shù)量、神經(jīng)元之間連接的權(quán)重以及偏置項(xiàng),再對(duì)時(shí)間間隔為一天的多源歷史數(shù)據(jù)集進(jìn)行訓(xùn)練與擬合,得到大尺度深度學(xué)習(xí)模型;
所述數(shù)據(jù)庫(kù)模塊,用于存儲(chǔ)多源歷史數(shù)據(jù)和空氣質(zhì)量預(yù)報(bào)結(jié)果,選用MySQL作為數(shù)據(jù)庫(kù)管理系統(tǒng),存儲(chǔ)多源數(shù)據(jù)融合模塊中的每一條歷史數(shù)據(jù)以及深度學(xué)習(xí)模塊給出的每一次預(yù)報(bào)結(jié)果,包括每個(gè)空氣質(zhì)量預(yù)報(bào)站點(diǎn)的地理位置,將預(yù)報(bào)值與真實(shí)值進(jìn)行比對(duì),并作為優(yōu)化深度學(xué)習(xí)模塊所需的多源數(shù)據(jù)集和尺度模型的基礎(chǔ)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇省南通環(huán)境監(jiān)測(cè)中心;南通大學(xué),未經(jīng)江蘇省南通環(huán)境監(jiān)測(cè)中心;南通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010111029.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





