[發明專利]一種基于Spark的短期電力能耗預測方法有效
| 申請號: | 201910304495.X | 申請日: | 2019-04-16 |
| 公開(公告)號: | CN110008626B | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 姜書艷;趙云鵬;左志宏 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06Q10/04;G06Q50/06 |
| 代理公司: | 成都點睛專利代理事務所(普通合伙) 51232 | 代理人: | 孫一峰 |
| 地址: | 611731 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 spark 短期 電力 能耗 預測 方法 | ||
本發明公開了一種基于Spark的短期電力能耗預測方法。本發明的方法主要為,根據歷史電力能耗數據與天氣信息,使用STL時間序列分解與支持向量回歸對未來短期內電力能耗使用情況進行預測,并利用Spark分布式計算框架加速海量電力能耗數據下的模型訓練,從而提升了模型處理海量數據的能力,同時,由于使用STL時間序列分解算法,減少了各分量間的交叉影響,提升了模型的預測精度。
技術領域
本發明涉及一種基于Spark的短期電力能耗預測方法。
背景技術
目前,節能減排已成為我國實現可持續發展的重要舉措,然而,作為節能減排技術應用的主要載體,部分高校與園區能耗數據統計粗放,沒有科學的能耗監管、預測,無法依靠歷史能耗數據輔助管理、完善系統以及制定相應的節能策略。而其原因,正是缺乏有效地對能耗數據監管,在理論上,也缺少對能耗模型的研究。而對電力能耗的分析預測能有效幫助挖掘節能潛力,推進園區的用能優化。
對能耗數據的分析預測,根據預測的期間,可將預測分為短期預測、中期預測和長期預測,分別對應一小時到一周,一周到一年和一年至數十年的預測。短期的預測一般用于保證系統的穩定性,中期的預測一般用于生產計劃的優化,長期一般用于輔助投資計劃的制定。傳統的預測方法無法很好地處理與能耗數據具有高度依賴的非線性關系的信息,如季節、天氣等,機器學習算法在這方面具有很大優勢。
物聯網的發展使得電力能耗數據的采集密度越來越高,采集規模不斷擴大,使用更多的電力能耗數據進行訓練使模型更具普適性,但也向模型的訓練效率效率提出了很高的要求。在海量數據下,單機環境由于面臨計算資源缺乏的問題,無法實現高效的訓練,為此,需要通過計算機集群實現大規模訓練數據的處理。
發明內容
本發明的目的是,針對上述問題,提供一種基于Spark分布式計算框架的電力能耗預測算法,通過STL時間序列分解與支持向量回歸在歷史能耗數據與天氣數據的基礎上,完成能耗預測,同時由于采用了Spark分布式計算框架的計算機集群,能有效應對單機環境下計算資源不足的問題。
本發明的技術方案分為訓練與預測階段:
在訓練階段,基于歷史能耗數據與天氣數據訓練模型:
第一步:電力能耗數據(時間信息與電力能耗值)與天氣數據的預處理與特征工程處理。由于現實存在的環境噪聲、網絡等隨機因素影響,數據不可避免的會出現數據丟失、錯誤與噪聲干擾等情況,因此需要通過預處理進行缺失數據的補點、離群點處理與降噪處理。特征工程處理使SVR算法能更好地捕獲數據間的非線性關系。
第二步:對電力能耗數據進行STL時間序列分解,得到趨勢項和周期項。
第三步:對于分解得到的趨勢項和周期項,通過模擬退火算法查找對應CascadeSVR模型的最優參數,模型的訓練數據為預處理與特征工程處理后的電力能耗數據與天氣數據。Cascade SVR模型需預先指定的超參數有懲罰系數C與RBF核參數γ,通過模擬退火算法能快速找到最優的C與γ。
第四步:使用第三步得到的最優參數訓練趨勢項與周期項的Cascade SVR模型,模型的訓練數據為預處理與特征工程處理后的電力能耗數據與天氣數據。
第五步:保存趨勢項與周期項SVR模型。
在預測階段,基于待預測時段的時間信息與天氣預報數據使用模型進行預測:
第一步:特征數據(時間信息與天氣預報數據)的特征工程處理,同訓練階段第一步。
第二步:使用特征數據與訓練階段得到的趨勢項與周期項SVR模型,分別對趨勢項與周期項進行預測。
第三步:整合趨勢項與周期項數據得到總體預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910304495.X/2.html,轉載請聲明來源鉆瓜專利網。





