[發(fā)明專利]一種基于XGBoost-LightGBM的機組功率預(yù)測方法在審
| 申請?zhí)枺?/td> | 202010135920.X | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111414717A | 公開(公告)日: | 2020-07-14 |
| 發(fā)明(設(shè)計)人: | 陳棋;楊秦敏;陳積明;王琳;孫優(yōu)賢;孫勇 | 申請(專利權(quán))人: | 浙江大學(xué);浙江運達風(fēng)電股份有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06K9/62;G06Q10/04;G06Q50/06 |
| 代理公司: | 杭州杭誠專利事務(wù)所有限公司 33109 | 代理人: | 尉偉敏 |
| 地址: | 310012 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 xgboost lightgbm 機組 功率 預(yù)測 方法 | ||
1.一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,包括以下步驟:
①離線建模;
②收集訓(xùn)練樣本集;
③對于訓(xùn)練集數(shù)據(jù)采用XGBoost做特征提取;
④劃分訓(xùn)練集和測試集;
⑤學(xué)習(xí)出LightGBM模型;
⑥在線預(yù)測。
2.根據(jù)權(quán)利要求1所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟1離線建模過程如下:
假設(shè)風(fēng)電機組運行過程中采集的監(jiān)測數(shù)據(jù)構(gòu)成原始數(shù)據(jù)集
X=[x1,x2,…,xn]T∈Rn×m
其中m表示監(jiān)控變量的個數(shù),n表示樣本個數(shù),xi∈Rn×m,i=1,…,n表示第i個樣本,Y=[y1,y2,L,yn]T∈Rn×1,yi∈R,i=1,L,n表示第i個樣本的功率值。
3.根據(jù)權(quán)利要求1或2所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟2收集的訓(xùn)練樣本集,即風(fēng)電機組運行SCADA數(shù)據(jù),包括風(fēng)機狀態(tài)、功率、風(fēng)速、風(fēng)向、溫度、機艙位置、對風(fēng)誤差、轉(zhuǎn)速、轉(zhuǎn)矩、槳距角、電網(wǎng)參數(shù)。
4.根據(jù)權(quán)利要求1所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟3特征提取通過XGBoost降低預(yù)處理后的原始數(shù)據(jù)集的維度,在保留數(shù)據(jù)集主要信息的同時,減少模型的計算量。
5.根據(jù)權(quán)利要求1或4所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟3對于給定的數(shù)據(jù)集,在樹模型構(gòu)建的過程中,每一層貪心地選取一個特征分割點作為葉子節(jié)點,使得在分割之后整棵樹增益值最大,分割過程中,每個葉子節(jié)點的權(quán)值可以表示為w(gi,hi),其中
訓(xùn)練誤差表示目標(biāo)值和預(yù)測值之間的差距,根據(jù)所有葉子節(jié)點的權(quán)值,考慮每個特征作為分割點的增益gain,有:
XGBoost在每一次迭代的時候都會增加一棵樹,則構(gòu)建K棵樹的線性組合為
其中,F(xiàn)表征包含所有樹的函數(shù)空間,fk(xi)表示的是第i個樣本在第k棵樹中被分類到所在葉子的權(quán)重。
6.根據(jù)權(quán)利要求1或5所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟3中XGBoost根據(jù)特征分裂的次數(shù)FScore、特征平均增益值A(chǔ)verage Gain或特征平均覆蓋率Average Cover來作為其構(gòu)建決策樹的依據(jù),以便準(zhǔn)確的完成分類任務(wù),對于上述3種重要性度量指標(biāo),有
FScore=|X| (5)
其中,X是所求特征分類到葉子節(jié)點的集合;gain是X中每個葉子節(jié)點由式(3)得到的在分割時節(jié)點增益值;cover是X中落在每個節(jié)點的樣本個數(shù)。
7.根據(jù)權(quán)利要求6所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟5中的Light GBM包括GOSS和EFB,所述GOSS技術(shù)的具體操作為:對數(shù)據(jù)集進行排序,按照梯度絕對值排序。排序以后挑選前a*100%的數(shù)據(jù)集。對剩余的數(shù)據(jù)進行隨機抽樣,比例為b*100%,之后具體計算信息增益時,對隨機抽取的數(shù)據(jù)放大一個常數(shù)。
8.根據(jù)權(quán)利要求7所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟5中的EFB技術(shù)為特征捆綁,將互斥特征進行捆綁,即它們很少同時取非零值,以有效減少特征數(shù)量。
9.根據(jù)權(quán)利要求8所述的一種基于XGBoost-LightGBM的機組功率預(yù)測方法,其特征在于,所述步驟6包括在線采集風(fēng)力發(fā)電機組運行過程的數(shù)據(jù),并對于采集到的樣本點,使用訓(xùn)練好的LightGBM模型對測試集的輸出功率進行預(yù)測。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué);浙江運達風(fēng)電股份有限公司,未經(jīng)浙江大學(xué);浙江運達風(fēng)電股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010135920.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于Xgboost框架的醫(yī)院門診就診量預(yù)測方法
- 一種基于xgBoost模型和Hadoop架構(gòu)的竊電識別分析方法及終端
- 基于改進XGBoost的泛癌癥基因通路預(yù)測方法、系統(tǒng)和存儲介質(zhì)
- 一種基于XGBoost算法的區(qū)塊鏈產(chǎn)品檢測方法、系統(tǒng)及裝置
- 用于XGBoost模型的解釋方法
- 基于XGboost模型的鋰離子電池荷電狀態(tài)估算
- 一種數(shù)據(jù)隱私保護協(xié)議的分析方法、裝置及電子設(shè)備
- 一種基于xgboost算法的短期電價預(yù)測方法及裝置
- 基于GA-PSO優(yōu)化XGBoost的水文時間序列預(yù)測方法
- 一種用戶異常用電行為檢測方法及裝置
- 一種基于形態(tài)聚類和LightGBM的工業(yè)用戶短期負荷預(yù)測方法
- 一種改進貝葉斯優(yōu)化的LightGBM故障診斷方法
- 一種基于LightGBM算法的交通量預(yù)測方法
- 貝葉斯優(yōu)化LightGBM的暫態(tài)穩(wěn)定評估方法
- 一種基于LightGBM模型的EEG信號情緒識別方法
- 一種電力數(shù)據(jù)網(wǎng)流量異常檢測方法、系統(tǒng)及電子設(shè)備
- 一種短期用電負荷預(yù)測方法
- 基于LightGBM回歸算法的水稻葉片可溶性糖積累量遙感反演模型和方法
- 一種基于LightGBM的鹽湖鋰濃度反演方法及系統(tǒng)
- 一種優(yōu)化LSTM和LightGBM參數(shù)的流感預(yù)測系統(tǒng)、存儲介質(zhì)和裝置





