[發(fā)明專利]基于隨機森林和ISCA優(yōu)化RELM的PM2.5濃度預(yù)測方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110588326.0 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113344261A | 公開(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計)人: | 馬慧心;張楚;彭甜;王業(yè)琴;趙環(huán)宇;張大鵬;錢程 | 申請(專利權(quán))人: | 淮陰工學(xué)院 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06N3/00 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 223003 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 隨機 森林 isca 優(yōu)化 relm pm2 濃度 預(yù)測 方法 系統(tǒng) | ||
1.一種基于隨機森林和ISCA優(yōu)化RELM的PM2.5濃度預(yù)測方法,其特征在于,包括以下步驟:
(1)獲得預(yù)設(shè)的時間范圍內(nèi)歷史的PM2.5濃度數(shù)據(jù),對所得的PM2.5濃度數(shù)據(jù)進行預(yù)處理,得到訓(xùn)練集和測試集;
(2)基于隨機森林算法對步驟(1)獲取的數(shù)據(jù)進行重要性分析,選取重要性高的特征數(shù)據(jù)作為輸入;
(3)確定正則化極限學(xué)習(xí)機的激活函數(shù),隱含層神經(jīng)元個數(shù)的搜索范圍設(shè)為20~200,利用正則化極限學(xué)習(xí)機對處理后的pm2.5濃度數(shù)據(jù)進行訓(xùn)練;
(4)采用均勻算法,非線性和混沌搜索對正余弦算法SCA進行改進,使用改進后的正余弦算法
(5)采用訓(xùn)練好ISCA-RELM模型對測試集樣本進行預(yù)測,得到測試樣本預(yù)測值,使用均方誤差、平均絕對標(biāo)度誤差,決定系數(shù)對預(yù)測值和實際值進行誤差指標(biāo)分析,判斷本模型的有效性。
2.根據(jù)權(quán)利要求1所述的基于隨機森林和ISCA優(yōu)化RELM的PM2.5濃度預(yù)測方法,其特征在于,步驟(1)所述的對數(shù)據(jù)進行預(yù)處理過程如下:
將樣本數(shù)據(jù)集分為互不相交的兩部分,一部分是訓(xùn)練集,另一部分是測試集;訓(xùn)練集占到70%,測試集占到數(shù)據(jù)的30%;判斷樣本數(shù)據(jù)集中PM2.5濃度中是否存在的突變點,突變點包括其PM2.5濃度值過大,短期內(nèi)PM2.5濃度值是否急劇增大或減小;若是,則對突變點平滑處理。
3.根據(jù)權(quán)利要求1所述的基于隨機森林和ISCA優(yōu)化RELM的PM2.5濃度預(yù)測方法,其特征在于,所述步驟(2)包括以下步驟:
(21)采用bootstrap方法進行抽樣,判斷數(shù)據(jù)重要性的計算公式如下:
VI=∑(error2-error1)/N (1)
其中,VI為數(shù)據(jù)重要性,error1為利用袋內(nèi)數(shù)據(jù)構(gòu)建隨機森林模型得到的袋外數(shù)據(jù)誤差;error2為在袋外數(shù)據(jù)的樣本中,隨機改變其中的某些數(shù)據(jù)要素后,得到的袋外誤差;N為隨機森林決策樹數(shù)量;
(22)對隨機森林中的特征數(shù)據(jù)按照重要性VI進行降序排序;
(23)刪除當(dāng)前特征數(shù)據(jù)中不重要的數(shù)據(jù),得到一個新的特征集;
(24)用新得到的特征集建立新的隨機森林,計算當(dāng)前特征集中的每個特征的重要性,并排序;
(25)重復(fù)(22)-(24),直到剩下m個特征集;
(26)將得到的特征集與其對應(yīng)的隨機森林,計算其袋外數(shù)據(jù)誤差率,選取袋外誤差最低的特征集作為輸入。
4.根據(jù)權(quán)利要求1所述的基于隨機森林和ISCA優(yōu)化RELM的PM2.5濃度預(yù)測方法,其特征在于,所述步驟(3)包括以下步驟:
(31)正則化極限學(xué)習(xí)機的目標(biāo)函數(shù)為:
其中,||β||2為結(jié)構(gòu)風(fēng)險,||ξi||2為經(jīng)驗風(fēng)險,γ為正則化系數(shù)即懲罰因子,表示在實際風(fēng)險中結(jié)構(gòu)風(fēng)險占的權(quán)衡比重,范圍設(shè)為2-8~28;
(32)引入拉格朗日乘子建立等式約束下的二次規(guī)劃式:
其中,α=[α1,α2,…αn]T,αj=[αj1,αj2,…αjm]T為拉格朗日乘子向量;
(33)通過解式(3)得到正則化極限學(xué)習(xí)機RELM的輸出權(quán)重矩陣為:
當(dāng)數(shù)據(jù)集訓(xùn)練樣本的個數(shù)大于隱藏層神經(jīng)元個數(shù),即N≤M時,I為N×N的單位矩陣,而當(dāng)訓(xùn)練樣本的個數(shù)小于隱藏層神經(jīng)元個數(shù),NM時,I為M×M的單位矩陣。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于淮陰工學(xué)院,未經(jīng)淮陰工學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110588326.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





