[發明專利]基于Kohonen網絡聚類和ReliefF特征選擇的空氣質量指數預測方法有效
| 申請號: | 201910756927.0 | 申請日: | 2019-08-16 |
| 公開(公告)號: | CN110569883B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 陳伯倫;朱國暢;朱全銀;袁燕;于永濤;馬甲林 | 申請(專利權)人: | 淮陰工學院 |
| 主分類號: | G06F18/23 | 分類號: | G06F18/23;G06F18/211;G06V10/82;G06N3/0464;G06N3/088;G06Q10/04;G01W1/10 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 王恒靜 |
| 地址: | 223005 江蘇省淮安市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 kohonen 網絡 relieff 特征 選擇 空氣質量 指數 預測 方法 | ||
本發明公開了一種基于Kohonen網絡聚類和ReliefF特征選擇的空氣質量指數預測方法,包括:(1)對空氣數據集進行預處理,得到處理后的空氣數據集;(2)采用Kohonen網絡聚類得到第k類數據集;(3)采用ReliefF特征選擇算法處理數據集,得到第k類數據集特征重要程度的排名;(4)通過特征重要程度排名,得到第k類經過特征選擇后的數據集;(5)通過NAR神經網絡得到第k類NAR神經網絡訓練模型;(6)根據數據x所在類的特征排名選取特征,得到預測結果。本發明利用Kohonen網絡聚類對空氣數據進行聚類,獲得在相同時間段內變化規律相似的類別,發掘更為準確的預測模型,提高預測精度;利用ReliefF特征選擇算法獲得特征排名,去除對預測幫助較小的特征,從而提高運行效率。
技術領域
本發明涉及無監督聚類和預測技術領域,具體涉及一種基于Kohonen網絡聚類和ReliefF特征選擇的空氣質量指數預測方法。
背景技術
空氣質量指數是用來評價空氣質量的重要指標,通過對一氧化碳濃度、二氧化氮濃度、臭氧濃度、PM10濃度、PM2.5濃度、二氧化硫濃度進行計算,從而得出空氣質量指數。空氣質量指數越高,空氣污染越嚴重,反之,空氣質量越好。與天氣具有陰晴等不同模式一樣,空氣在相同時間段內也具有不同的模式。
在面向空氣質量指數預測問題時,浙江工商大學王效靈等人提出了一種基于PSODE-BP神經網絡的空氣質量預測方法(中國專利公開號:CN 109063938 A,2018.12.21),用CPSODE算法來優化BP神經網絡的連接權值和閾值,這種方法并未充分挖掘空氣之間的關系,即在相同時間段內空氣存在不同的模式,只運用一個統一模型進行預測,沒有對不同的空氣模式進行處理;
上海電力學院的張挺提出了一種基于聚類算法的空氣質量預測方法(中國專利公開號:CN 108564110 A,2018.09.21),通過計算待預測的數據與聚類后子類平均向量的距離,選取該子類中距離最近的向量作為待預測值,大量的特征導致運行效率降低,同時泛化性能差。
發明內容
發明目的:為了克服現有技術的不足,本發明提供一種基于Kohonen網絡聚類和ReliefF特征選擇的空氣質量指數預測方法,該方法解決了預測時特征量過多且未曾考慮空氣具有不同的模式導致的預測效率差的問題。
技術方案:本發明所述的基于Kohonen網絡聚類和ReliefF特征選擇的空氣質量指數預測方法,包括:
(1)對原始空氣數據集Air進行預處理,得到處理后的空氣數據集A;
(2)采用Kohonen網絡聚類,將數據集A分為m類,得到第k類數據集Ak,k∈ [1,m];
(3)采用ReliefF特征選擇算法處理數據集Ak,得到第k類數據集Ak特征重要程度的排名Rk;
(4)通過特征重要程度排名Rk,刪去第k類數據集Ak排名后c個特征,得到第k 類經過特征選擇后的數據集Fk;
(5)通過NAR神經網絡,用數據集Fk前t天的數據預測t+1天的空氣質量指數,得到第k類NAR神經網絡訓練模型netk。
(6)隨機選取數據集A中一條數據x,根據x所在類的特征排名Rz選取特征,用模型netz得到預測結果y。
進一步地,包括:
所述步驟1的具體方法為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淮陰工學院,未經淮陰工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910756927.0/2.html,轉載請聲明來源鉆瓜專利網。





