[發(fā)明專利]一種基于多層注意力機制的空氣質量推斷方法有效
| 申請?zhí)枺?/td> | 202011563544.0 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112765229B | 公開(公告)日: | 2022-08-16 |
| 發(fā)明(設計)人: | 韓啟龍;張玉穎;宋洪濤;王也;李麗潔 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/215;G06F16/951;G01N33/00;G06N3/04;G06N3/08;G06Q10/06;G06Q50/26 |
| 代理公司: | 哈爾濱市陽光惠遠知識產(chǎn)權代理有限公司 23211 | 代理人: | 劉景祥 |
| 地址: | 150001 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多層 注意力 機制 空氣質量 推斷 方法 | ||
1.一種基于多層注意力機制的空氣質量推斷方法,其特征在于,所述空氣質量推斷方法包括以下步驟:
S100、將城市劃分為大小相同的網(wǎng)格區(qū)域,對于網(wǎng)格內(nèi)沒有部署空氣質量監(jiān)測傳感器的區(qū)域劃分為待推斷區(qū)域,待推斷區(qū)域的周圍八個網(wǎng)格區(qū)域作為局部區(qū)域,已部署空氣質量監(jiān)測傳感器的區(qū)域作為全局區(qū)域;
S200、獲取影響空氣質量數(shù)據(jù)相關的時序數(shù)據(jù)和非時序數(shù)據(jù),所述獲取影響空氣質量數(shù)據(jù)相關的時序數(shù)據(jù)包括:歷史空氣質量數(shù)據(jù)、氣象數(shù)據(jù)和天氣預報數(shù)據(jù),所述空氣質量的非時序數(shù)據(jù)包括:城市的路網(wǎng)數(shù)據(jù)和城市興趣點數(shù)據(jù);
S300、對時序數(shù)據(jù)和非時序數(shù)據(jù)進行數(shù)據(jù)處理,對于時序數(shù)據(jù),去除會影響模型推斷能力的部分突變值,對于時序數(shù)據(jù)的缺失值采用滑動窗口進行填充,對于非時序數(shù)據(jù)的缺失值采用平均值進行填充;
S400、構建多層注意力機制神經(jīng)網(wǎng)絡模型,所述多層注意力機制神經(jīng)網(wǎng)絡模型包括混合注意力層、空間注意力層、融合層和推斷層;
S500、將處理完的數(shù)據(jù)輸入到多層注意力機制神經(jīng)網(wǎng)絡模型中,進行訓練;
S600、對待推斷區(qū)域進行推斷,
其中,S400具體包括以下步驟:
S410、所述混合注意力層,該層包括時間注意力和全連接神經(jīng)網(wǎng)絡兩個部分,對于時序數(shù)據(jù),將其輸入到LSTM中,并且通過注意力層對各個LSTM的不同的隱藏層進行加權作為最終時序數(shù)據(jù)的輸出值;對于非時序數(shù)據(jù),將其輸入到全連接神經(jīng)網(wǎng)絡中,最后的輸出和時間注意力的輸入進行融合;
S420、所述空間注意力層,該層包括局部空間注意力層和全局空間注意力層,局部空間注意力層用于對局部空間區(qū)域特征進行輸入,并且通過待推斷區(qū)域經(jīng)過混合注意力層得到的特征對局部空間區(qū)域特征進行打分并且加權求和作為局部空間區(qū)域的特征;全局空間注意力層用于對已經(jīng)部署空氣監(jiān)測站點區(qū)域的特征進行輸入,并且通過待推斷區(qū)域經(jīng)過混合注意力層得到的特征對全局空間區(qū)域進行打分并且加權求和作為全局空間區(qū)域的特征;
S430、所述融合層,該層將經(jīng)過空間注意力層的局部空間特征和全局空間特征以及待推斷區(qū)域的特征輸入到全連接層;
S440、所述推斷層,該層將融合層的數(shù)據(jù)作為空氣質量推斷的輸入,將輸出值也就是對該區(qū)域的空氣質量推斷值,通過損失函數(shù)得到與真實值的誤差,將誤差經(jīng)過模型反向傳播,不斷迭代,調(diào)整模型參數(shù),得到訓練后的神經(jīng)網(wǎng)絡模型。
2.根據(jù)權利要求1所述的一種基于多層注意力機制的空氣質量推斷方法,其特征在于,S100具體包括以下步驟:
S110、將城市進行網(wǎng)格區(qū)域劃分,將城市區(qū)域劃分為邊長為c的相互不相交的正方形網(wǎng)格Ri,每個網(wǎng)格區(qū)域的周圍八個相鄰的網(wǎng)格區(qū)域作為局部空間區(qū)域,其他已經(jīng)部署傳感器的區(qū)域作為全局區(qū)域;
S120、將每個網(wǎng)格區(qū)域的中心點的經(jīng)緯度作為網(wǎng)格坐標,將所述網(wǎng)格坐標作為待推斷的基本單元。
3.根據(jù)權利要求1所述的一種基于多層注意力機制的空氣質量推斷方法,其特征在于,S200具體包括以下步驟:
S210、采用爬蟲程序定時對天氣網(wǎng)的天氣數(shù)據(jù)進行爬取,獲得城市空氣質量數(shù)據(jù),將爬取得到的歷史空氣質量數(shù)據(jù)持久化存儲到數(shù)據(jù)庫中,記網(wǎng)格區(qū)域Ri的空氣質量數(shù)據(jù)為
S220、用爬蟲程序定時對中國天氣網(wǎng)的天氣數(shù)據(jù)進行爬取,獲取城市的氣象數(shù)據(jù),將爬取得到的氣象數(shù)據(jù)持久化至數(shù)據(jù)庫存儲,所述氣象數(shù)據(jù)包括歷史氣象數(shù)據(jù)和實時氣象數(shù)據(jù),所述氣象數(shù)據(jù)具體為:溫度、濕度、風速以及風向,記歷史時間網(wǎng)格區(qū)域Ri的氣象數(shù)據(jù)為歷史氣象數(shù)據(jù)
S230、采用爬蟲程序定時對天氣網(wǎng)的天氣數(shù)據(jù)進行爬取,獲取天氣預測數(shù)據(jù),將爬取得到的天氣預測數(shù)據(jù)持久化至數(shù)據(jù)庫存儲,記t時刻網(wǎng)格區(qū)域Ri天氣預測數(shù)據(jù)為WFtRi;
S240、獲取城市的路網(wǎng)結構數(shù)據(jù),所述路網(wǎng)結構數(shù)據(jù)包括道路的條數(shù)、長度和類別,記網(wǎng)格區(qū)域Ri的路網(wǎng)結構數(shù)據(jù)為RoadRi;
S250、獲取城市的興趣點數(shù)據(jù),所述興趣點數(shù)據(jù)包括特定點的集合和屬性集,所述集合包括學校、醫(yī)院和商場,所述屬性集包括名稱、類別和坐標,記網(wǎng)格區(qū)域Ri的城市興趣點數(shù)據(jù)為POIRi。
4.一種基于多層注意力機制的空氣質量推斷方法,其特征在于,所述空氣質量推斷方法包括以下步驟:
S100、將城市劃分為大小相同的網(wǎng)格區(qū)域,對于網(wǎng)格內(nèi)沒有部署空氣質量監(jiān)測傳感器的區(qū)域劃分為待推斷區(qū)域,待推斷區(qū)域的周圍八個網(wǎng)格區(qū)域作為局部區(qū)域,已部署空氣質量監(jiān)測傳感器的區(qū)域作為全局區(qū)域;
S200、獲取影響空氣質量數(shù)據(jù)相關的時序數(shù)據(jù)和非時序數(shù)據(jù),所述獲取影響空氣質量數(shù)據(jù)相關的時序數(shù)據(jù)包括:歷史空氣質量數(shù)據(jù)、氣象數(shù)據(jù)和天氣預報數(shù)據(jù),所述空氣質量的非時序數(shù)據(jù)包括:城市的路網(wǎng)數(shù)據(jù)和城市興趣點數(shù)據(jù);
S310、采用統(tǒng)計學中的pettitt算法,對空氣質量中的時序突變值進行檢測并且進行去除,采用相鄰48小時的時間片的平均值進行填充;
S320、對于時序數(shù)據(jù)的缺失值,采用當前時刻當日的平均值進行填充;
S330、對于非時序數(shù)據(jù)的缺失值,采用所述非時序數(shù)據(jù)類型的眾數(shù)進行填充;
S400、構建多層注意力機制神經(jīng)網(wǎng)絡模型,所述多層注意力機制神經(jīng)網(wǎng)絡模型包括混合注意力層、空間注意力層、融合層和推斷層;
S500、將處理完的數(shù)據(jù)輸入到多層注意力機制神經(jīng)網(wǎng)絡模型中,進行訓練;
S600、對待推斷區(qū)域進行推斷,
其中,S400具體包括以下步驟:
S410、所述混合注意力層,該層包括時間注意力和全連接神經(jīng)網(wǎng)絡兩個部分,對于時序數(shù)據(jù),將其輸入到LSTM中,并且通過注意力層對各個LSTM的不同的隱藏層進行加權作為最終時序數(shù)據(jù)的輸出值;對于非時序數(shù)據(jù),將其輸入到全連接神經(jīng)網(wǎng)絡中,最后的輸出和時間注意力的輸入進行融合;
S420、所述空間注意力層,該層包括局部空間注意力層和全局空間注意力層,局部空間注意力層用于對局部空間區(qū)域特征進行輸入,并且通過待推斷區(qū)域經(jīng)過混合注意力層得到的特征對局部空間區(qū)域特征進行打分并且加權求和作為局部空間區(qū)域的特征;全局空間注意力層用于對已經(jīng)部署空氣監(jiān)測站點區(qū)域的特征進行輸入,并且通過待推斷區(qū)域經(jīng)過混合注意力層得到的特征對全局空間區(qū)域進行打分并且加權求和作為全局空間區(qū)域的特征;
S430、所述融合層,該層將經(jīng)過空間注意力層的局部空間特征和全局空間特征以及待推斷區(qū)域的特征輸入到全連接層;
S440、所述推斷層,該層將融合層的數(shù)據(jù)作為空氣質量推斷的輸入,將輸出值也就是對該區(qū)域的空氣質量推斷值,通過損失函數(shù)得到與真實值的誤差,將誤差經(jīng)過模型反向傳播,不斷迭代,調(diào)整模型參數(shù),得到訓練后的神經(jīng)網(wǎng)絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經(jīng)哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011563544.0/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





