[發明專利]基于Kohonen網絡聚類和ReliefF特征選擇的空氣質量指數預測方法有效
| 申請號: | 201910756927.0 | 申請日: | 2019-08-16 |
| 公開(公告)號: | CN110569883B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 陳伯倫;朱國暢;朱全銀;袁燕;于永濤;馬甲林 | 申請(專利權)人: | 淮陰工學院 |
| 主分類號: | G06F18/23 | 分類號: | G06F18/23;G06F18/211;G06V10/82;G06N3/0464;G06N3/088;G06Q10/04;G01W1/10 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 王恒靜 |
| 地址: | 223005 江蘇省淮安市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 kohonen 網絡 relieff 特征 選擇 空氣質量 指數 預測 方法 | ||
1.一種基于Kohonen網絡聚類和ReliefF特征選擇的空氣質量指數預測方法,其特征在于,包括:
(1)對原始空氣數據集Air進行預處理,得到處理后的空氣數據集A;
(2)采用Kohonen網絡聚類,將數據集A分為m類,得到第k類數據集Ak,k∈[1,m];
(3)采用ReliefF特征選擇算法處理數據集Ak,得到第k類數據集Ak特征重要程度的排名Rk;
所述步驟3的具體包括:
(31)定義第k類數據集Ak的第f個特征,f∈[1,7×t],f的初始值為1;
(32)定義數據集Ak為ReliefF算法的類別Fk1,其余類別為ReliefF算法的類別Fk2,k的初始值為1;
(33)定義Pk為類別Fk1在數據集A中所占的比例;
(34)定義diff(f,x,y)表示樣本x與樣本y在特征f上的差,如果x(f)=y(f),則diff(f,x,y)=0,否則diff(f,x,y)=1;
(35)從類別Fk1中隨機選取一個樣本x,選取與該樣本距離最近的q個最近鄰Hk,Hk={h1,h2,…,hr,…,hq},從類別Fk2中選取與該樣本距離最近的q個最近鄰Mk,Mk={m1,m2,…,mr,…,mq};
(36)令特征權重W(f)=0;表示為:
(37)f=f+1;
(38)如果f7×t,跳轉到步驟(39),否則跳轉到步驟(35);
(39)對特征權重W(f)進行排序,得到第k類數據集Ak的特征排名Rk;
(310)k=k+1;
(311)如果km,跳轉到步驟(312),否則,跳轉到步驟(34);
(312)得到所有類別的特征排名R,R={R1,R2,…,Rk,…,Rm};
(4)通過特征重要程度排名Rk,刪去第k類數據集Ak排名后c個特征,得到第k類經過特征選擇后的數據集Fk;
(5)通過NAR神經網絡,用數據集Fk前t天的數據預測t+1天的空氣質量指數,得到第k類NAR神經網絡訓練模型netk;
(6)根據數據集A中隨即數據x所在類的特征排名Rz選取特征,用模型netz得到預測結果y;
所述步驟6具體包括:
(61)定義z為x所在的第z類,z∈[1,m];
(62)令k=1,dmin為dxk的最小值;
(63)計算Ak類的中心ak,即Ak中所有數據的平均值;
(64)計算x與ak的距離dxk,dxk=||x-dxk||;
(65)如果dmindxk,跳轉到步驟(66),否則跳轉到步驟(68);
(66)dmin=dxk;z=k;
(67)k=k+1;
(68)如果km,跳轉到步驟(69),否則跳轉到步驟(63);
(69)令f=7×t;
(610)查詢特征f在Rz中的特征排名;
(611)如果f在特征排名Rz后c個,c∈[1,7×t-1],則跳轉到步驟(612),否則跳轉到步驟(614);
(612)如果f不是空氣質量指數,則跳轉到步驟(613),否則跳轉到步驟(614);
(613)刪除f所在特征;
(614)f=f-1;
(615)如果f=0,則跳轉到步驟(616),否則跳轉到步驟(610);
(616)遍歷結束,得到經過特征選擇后的x’;
(617)將x’作為所在類的NAR神經網絡訓練模型netz的輸入,得到預測結果y。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淮陰工學院,未經淮陰工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910756927.0/1.html,轉載請聲明來源鉆瓜專利網。





