[發明專利]一種基于ARIMA-SVM組合模型的空氣質量預測算法在審
| 申請號: | 201911089421.5 | 申請日: | 2019-11-08 |
| 公開(公告)號: | CN111143768A | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 彭藝;楊濤鋒 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 arima svm 組合 模型 空氣質量 預測 算法 | ||
本發明涉及一種基于ARIMA?SVM組合模型的空氣質量預測算法,屬于數據挖掘領域。該算法首先對空氣質量數據進行平穩性檢驗,若非平穩通過差分處理使數據平穩,接著根據數據yt特點進行ARIMA建模分析,得到預測結果接著對預測結果的殘差Nt使用SVM模型進行預測分析得到結果把兩個模型的預測結果相加即得到ARIMA?SVM組合模型的預測結果。本發明提出的組合模型能夠改進現有的單一模型在對空氣質量數據進行分析預測的時候不能同時挖掘數據的線性以及非線性特征信息造成預測精度的下降的問題,大幅度提高預測精度。
技術領域
本發明涉及一種數據挖掘領域,具體的涉及一種基于ARIMA-SVM組合模型的空氣質量預測算法。
背景技術
近年來,隨著工業生產的發展與人類活動的增加,造成大量能源消耗與廢物排放,空氣質量問題日益突出,尤其是可吸入顆粒物(PM2.5)嚴重影響人體健康。因此空氣質量的精準預測對人們的生產、生活、培養保護環境意識等具有重要的指導意義。
PM2.5濃度受多個因素影響同時兼具線性和非線性的特點,目前對PM2.5的預測主要有神經網絡、灰色預測、時空數據模型、支持向量機等方法。以上的這些現有的單一模型在對空氣質量數據進行分析預測的時候不能同時挖掘數據的線性以及非線性特征信息造成預測精度的下降。
發明內容
為了彌補先有技術的不足,本發明提供了一種能同時挖掘數據線性以及非線性信息從而提高預測精度的一種基于基于ARIMA-SVM組合模型的空氣質量預測算法。
為實現上述目的,設計了三個部分:ARIMA模型預測、SVM模型預測、確定組合模型的預測結果。
其各個部分的方法如下:
所述ARIMA(p,d,q)模型預測,ARIMA模型只能對嚴平穩數據進行預測分析,對數據進行平穩性檢驗,若是嚴平穩則不對數據進行處理,若是非嚴平穩怎對數據進行d階差分處理使數據變為嚴平穩。
對ARIMA(p,d,q)模型進行定階主要是確定(p,d,q)的值,其中d的值在第一步中已經確認。在ARIMA的數學模型中,一般把時間序列在某時刻的值視為過去若干時間值與一組白噪聲的線性疊加。即:
式(1)中yt是待分析的平穩時間序列,εt為白噪聲序列。通過對序列自相關系數圖以及偏自相關系數圖的觀察可以確定自回歸階數p和移動平均階數q,模型完成定階后,可確定系數γi、γi。
ARIMA模型定階完成后,對濃度數據yt進行ARIMA建模得到預測結果
所述的SVM模型預測主要的工作是:支持向量機(SVM)最初被提出來用來解決分類問題,后來隨著理論的發展通過非線性映射把數據映射到高維空間完成線性回歸以此來解決原來樣本空間的非線性回歸問題。設訓練集xi∈RD,yi∈R,則設SVM的回歸方程為:
式中w是權向量,b是擬合偏差,“·”表示內積,f(x)是x的非線性函數,同時f(x)又是的線性函數,這樣就把問題由原本空間的非線性回歸轉化為了高維空間的線性回歸。為了減少計算量,引入核函數取代高維空間中的內積運算將其轉化為原樣本空間運算,得到SVM的非線性擬合函數:
式中為權值,根據Mercer定理K(xi,xj)為滿足的核函數。
把對濃度數據yt進行ARIMA建模得到預測結果與實際空氣濃度數據yt進行作差處理得到殘差
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911089421.5/2.html,轉載請聲明來源鉆瓜專利網。





