[發明專利]一種基于深度學習的PM2.5 在審
| 申請號: | 202011041190.3 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112183625A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 焦利民;毛文婧;王衛林;劉安寶;張威 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06F16/28 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 齊晨涵 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 pm base sub 2.5 | ||
1.一種基于深度學習并結合多源數據的PM2.5高精度時空預測的方法,其特征在于,包括以下步驟:
步驟1:選取影響PM2.5的多源數據進行預處理和影響因素分析,所述多源數據包括地面監測站點PM2.5數據、氣象數據、空間相關數據以及物理特征數據;
步驟2:對所述多源數據進行時空匹配;
步驟3:基于時空相關性將多源數據進行聚類并找到合適的時間滯后值;
步驟4:利用遞歸的LSTM模型,對各個聚類的站點PM2.5進行訓練,并評估本預測方法的精度;
步驟5:對預報結果進行精細PM2.5時空分布制圖。
2.根據權利要求1所述的方法,其特征在于:
所述步驟1中對多源數據進行預處理的過程具體為:對數據預先進行異常值剔除和缺失值填補,其中缺失值填補采用前置填補法、后置填補法,對于空間相關因素采用周圍均值填補法。
3.根據權利要求1所述的方法,其特征在于:
所述步驟1中空間相關數據包括氣象數據、建筑用地數據、道路長度數據、人口密度數據、歸一化的植被指數數據、高程數據以及空間滯后變量,其中氣象數據包括降水量、氣壓、相對濕度、日照、溫度以及風向風速。
4.根據權利要求3所述的方法,其特征在于:所述空間滯后變量主要基于Python進行數據處理和分析,其計算方法的公式如下:
式中:ds表示空間距離,m表示空間鄰近網格單元數,w表示權值。
5.根據權利要求1所述的方法,其特征在于:
步驟2中對多源數據進行時空匹配的具體過程為:采用格網化方式對多源數據進行時空匹配,將范圍內覆蓋的區域劃分為分辨率為n的網格,其中,n由區域大小所確定,其中將覆蓋地面監測站的格網作為訓練樣本輸入模型中。
6.根據權利要求1所述的方法,其特征在于:
所述步驟3中基于時空相關性,主要以皮爾遜相關系數為衡量標準,對監測站點進行聚類并找到合適的時間滯后值,所述皮爾遜相關系數如下:
式中:X和Y代表兩個變量,Cov(X·Y)表示兩個變量間的協方差,σxσy分別表示兩個變量的標準差。
7.根據權利要求1所述的方法,其特征在于:
所述步驟4中進行訓練前需要先對各個聚類的站點PM2.5真值的格網數據集歸一化處理并結合相關輔助數據再輸入到LSTM改進的模型中進行訓練。
8.根據權利要求7所述的方法,其特征在于:
所述歸一化處理為最大最小歸一化處理,具體公式如下:
9.根據權利要求7所述的方法,其特征在于:
結合相關輔助數據的具體操作為:將輔助數據進行正則化處理,再結合時間數據進行獨熱編碼。
10.根據權利要求1所述的方法,其特征在于:
所述步驟4中遞歸的LSTM模型框架為:
式中:tN表示當前時刻,gM表示當前格網,表示當前時刻該格網的PM2.5濃度值,tN-n表示n小時前的時刻,m表示鄰近格網個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011041190.3/1.html,轉載請聲明來源鉆瓜專利網。





