[發明專利]一種基于CNN-LSTM的風速預測方法在審
| 申請號: | 202011106976.9 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112285376A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 袁咪咪;宮法明;李昕;徐晨曦;劉芳華;司朋舉;唐昱潤 | 申請(專利權)人: | 中國石油大學(華東) |
| 主分類號: | G01P5/00 | 分類號: | G01P5/00;G01W1/10;G06F17/15;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 cnn lstm 風速 預測 方法 | ||
1.一種基于CNN-LSTM的風速預測方法,其特征及具體步驟如下:
S1,對氣象要素的原始記錄數據進行數據清洗。對于其中的缺損值或奇異值,將該值替換成前后兩個值的平均值或是某一時間區間的均值,當遇到非數值型數據時進行數據格式編碼;
S2,以N個站點的F個氣象要素的歷史記錄數據作為輸入,通過Z-score方法對數據進行標準化處理,使其滿足(0,1)標準正態分布;
S3,利用PCA技術將原來具有一定相關性的F個氣象要素進行線性組合,通過正交變換將其轉換為一組線性不相關的變量;
S4,通過LASSO算法從上步驟產生的變量中提取影響風速變化的氣象要素特征集,將其作為預測模型的輸入;
S5,通過空間特征提取算法提取目標站點和其相鄰站點的氣象因素之間的潛在空間關系,得到目標站點在T個預報時次上的空間特征向量,結合莫蘭指數對風速變化的空間關系進行分析檢驗;
S6,通過時間特征提取算法在T個空間特征向量上提取時間特征關系,并采用Adam算法不斷優化,獲得目標站點的風速預測結果;
S7,以預測值和真實值的擬合度平均絕對百分比誤差MAPE作為評估指標,在測試集上驗證風速預測的準確率。
2.根據權利1所述的一種基于CNN-LSTM的風速預測方法,其特征在于,對于步驟S2,本發明采用Z-score數據標準化算法對步驟S1中的數據進行標準化處理,將所有數據同樣轉換為零值附近區域值,處理后的數據滿足(0,1)標準正態分布,定義表示為:
式(1)中,某一氣象要素的平均值,σ為該氣象要素的標準差。
3.根據權利1所述的一種基于CNN-LSTM的風速預測方法,其特征在于,對于步驟S3,本發明采用基于SVD分解協方差矩陣實現的PCA主成分分析方法。設定原始氣象要素集X={x1,x2,x3,...,xn}并將其表示為二維矩陣。將每一個氣象要素的數據減去各自的平均值得到新的矩陣向量。計算協方差矩陣XXT,通過SVD計算協方差矩陣XXT的特征值與特征向量并對特征值從大到小排序,選擇其中最大的k個。然后將k個特征向量分別作為列向量組成特征向量矩陣做低維投影降維,將數據轉換到k個特征向量構建的新空間中。
4.根據權利1所述的一種基于CNN-LSTM的風速預測方法,其特征在于,對于步驟S4,本發明采用LASSO算法從PCA篩選出的主成分中進一步提取出能夠對風速變化帶來顯著影響的特征氣象要素。通過LASSO回歸構造一個懲罰函數得到一個精煉模型,使得它壓縮一些系數同時設定一些系數為0。在本發明中,給定有m個氣象要素的特征向量x=(x1,x2,...,xm)其中xi為x在第i個特征上的取值,通過m個氣象特征的線性組合來進行預測風速,具體計算如下:
f(x)=w1x1+w2x2+...+wmxm (2)
式(2)中,(w1,w2,...wm)是特征氣象要素的權重。損失函數定義為:
loss(w)=||f(x)-y||2+σ||w|| (3)
式(3)中,y表示風速實測值,σ||w||是正則化項,具體計算如下,
式(4)中,n為某一氣象要素的樣本個數,k為參數個數,其中的為L1正則化。通過對loss(w)求最小值,LASSO模型學習得到w,從而LASSO回歸模型得以確定。隨著懲罰力度的加強(超參數σ變大),越來越多的變量會被收縮為0,從而得到最終的特征氣象要素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油大學(華東),未經中國石油大學(華東)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011106976.9/1.html,轉載請聲明來源鉆瓜專利網。





