[發明專利]一種基于混合模型組合算法的多特征水質預測方法在審
| 申請號: | 201910681939.1 | 申請日: | 2019-07-26 |
| 公開(公告)號: | CN110619418A | 公開(公告)日: | 2019-12-27 |
| 發明(設計)人: | 熊慶宇;徐瑞;吳超;易華玲;王凱歌;王楷 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/06;G06F17/50;G06N3/04 |
| 代理公司: | 50214 重慶中流知識產權代理事務所(普通合伙) | 代理人: | 胡長生 |
| 地址: | 400044 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 水質預測模型 水質 預測 預處理 水質變化趨勢 數據歸一化 測量領域 處理目標 混合模型 目標序列 水質環境 算法處理 算法結合 特征預測 天氣影響 線性信息 預測數據 組合算法 數據集 構建 去噪 填充 融合 | ||
本發明涉及水質環境測量領域,本發明提出的一種基于混合模型組合算法的多特征水質預測方法,包括:S1、建立水質預測數據集;S2、對數據集進行預處理,包括去噪、缺失值填充和數據歸一化操作;S3、基于SARIMA和LSTM組合多特征預測方法構建水質預測模型;S4、使用上述水質預測模型預測未來一段時間內水質變化趨勢。該方法將序列分為兩部分來處理,其中SARIMA算法處理目標序列線性信息,LSTM算法結合水質和天氣影響因素來處理目標序列復雜多變的非線性部分信息,最后對兩部分信息做融合得到完整預測值。
技術領域
本發明涉及水質環境測量領域,具體涉及一種基于SARIMA和LSTM組合算法的多特征水質預測方法。
背景技術
現代科技的進步發展是以自然資源的不斷消耗為代價的,水質環境保護在當代社會顯得越來越重要。在實際工作中,水質監測主要還是依靠人工判斷,缺乏有效的預警體系,且監察不當容易導致環境的惡性發展,因此,環境保護工作中發展更敏捷、更智能的監測手段也變得越來越有必要。
目前智能檢測方法使用技術主要分為了傳統時間序列預測方法、機器學習方法、深度學習方法及各類組合方法。傳統時間序列預測方法能夠利用數據間的線性關系,很好地捕捉其線性動態發展趨勢,因其簡單、易操作的特性,此類模型在時間序列預測領域應用非常廣泛,但是,對于復雜非線性特征,它無法捕捉到不穩定數據間的規律,因此傳統時序模型還是存在不足。例如,單獨的SARIMA 算法擅長于線性預測,不能很好地處理數據中非線性信息,而LSTM算法雖然具有強大的數據挖掘能力,但模型訓練復雜度高,且因數據量大小限制,容易造成模型過度擬合。
由于水環境生態系統組成成分復雜,水質影響因素通常會表現為某一個特征內具有較強時間依賴性,特征之間又有相互作用、相互反映的特性。但目前的水質預測方法中,包括傳統時間序列預測方法、機器學習方法以及深度學習方法,都只針對水質中某一個因素做預測,而忽略了與其緊密關聯的其他影響因素。
發明內容
本發明的目的是提供一種基于混合模型組合算法的多特征水質預測方法,其避免了LSTM算法需要大量數據樣本的局限性,同時,既可以利用好SARIMA算法的線性部分處理優勢,得到一個可解釋性線性預測結果,又能夠在此基礎上,通過LSTM算法融合目標預測特征的相關天氣、水質影響因素,抓取在SARIMA算法中被忽視的非線性信息,對數據非線性部分做單獨處理,在兩部分信息都被充分挖掘的情況下,得到一個更精確的預測值。
本發明提出的一種基于混合模型組合算法的多特征水質預測方法,包括:
S1、建立水質預測數據集;
S2、對數據集進行預處理,包括去噪、缺失值填充和數據歸一化操作;
S3、基于SARIMA和LSTM組合多特征預測方法構建水質預測模型;
S4、使用上述水質預測模型預測未來一段時間內水質變化趨勢。
本發明一種基于混合模型組合算法的多特征水質預測方法的有益效果:該方法將序列分為兩部分來處理,其中SARIMA算法處理目標序列線性信息,LSTM算法結合水質和天氣影響因素來處理目標序列復雜多變的非線性部分信息,最后對兩部分信息做融合得到完整預測值。這樣選擇是由于SARIMA算法擅長于線性預測,不能很好地處理數據中非線性信息,而LSTM算法雖然具有強大的數據挖掘能力,但模型訓練復雜度高,且因數據量大小限制,容易造成模型過擬合。故選擇引入LSTM算法輔助SARIMA算法提高其預測精度,該混合算法從理論上來說,首先避免了LSTM算法需要大量數據樣本的局限性,同時,既可以利用好SARIMA 算法的線性部分處理優勢,得到一個可解釋性線性預測結果,又能夠在此基礎上,通過LSTM算法抓取在SARIMA算法中被忽視的非線性信息,對數據非線性部分做單獨處理,在兩部分信息都被充分挖掘的情況下,得到一個更精確的預測值。因此,該方法能夠使訓練出的模型具有更優的擬合效果,在實際水質預測過程中取得更好的精度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910681939.1/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





