[發(fā)明專利]用于風電計劃功率跟蹤的儲能設備控制策略制定方法有效
| 申請?zhí)枺?/td> | 201710470529.3 | 申請日: | 2017-06-20 |
| 公開(公告)號: | CN107026462B | 公開(公告)日: | 2018-05-04 |
| 發(fā)明(設計)人: | 李澤 | 申請(專利權)人: | 華北電力大學(保定) |
| 主分類號: | H02J3/28 | 分類號: | H02J3/28;H02J3/38;H02J3/24 |
| 代理公司: | 石家莊冀科專利商標事務所有限公司13108 | 代理人: | 李羨民,高錫明 |
| 地址: | 071003 河*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 計劃 功率 跟蹤 設備 控制 策略 制定 方法 | ||
1.一種用于風電計劃功率跟蹤的儲能設備控制策略制定方法,其特征是,所述方法在電力市場背景下,基于強化學習理論,采用SARSA學習方法制定風儲混合系統(tǒng)輸出功率控制策略,具體步驟如下:
a.輸入基礎數據,包括:混合系統(tǒng)與電網交易的各類費用參數;混合系統(tǒng)申報的計劃功率、混合系統(tǒng)申報的備用容量、風電實際輸出功率;儲能設備功率限值、容量限值、充放電效率、免懲罰時段數;SARSA學習算法參數;其中,混合系統(tǒng)與電網交易的各類費用參數包括備用電量價格、備用懲罰系數;SARSA學習算法參數包括學習因子、折扣因子、學習步數和懲罰系數;
b.初始化Q值函數;
c.設置時段數t=1、設置已實施的動作選擇次數Nn=0;
d.根據儲能設備t時段初始時刻存儲電量Es,t、風電實際功率與風儲混合系統(tǒng)計劃值之差ΔPh,t、儲能設備充放電狀態(tài)Ks,t、混合系統(tǒng)申報的備用容量確定t時段風儲混合系統(tǒng)所處的狀態(tài)st;
e.根據當前狀態(tài)st、值函數Qt(s,a)選擇控制動作at,具體步驟如下;
①在[0,1]區(qū)間內取隨機數TR;
②計算概率閥值TH:
式中:Nn為已經實施動作選擇的次數;NT為訓練全過程動作選擇的總次數;
③進行動作選擇:若TR>TH,隨機從可行動作集A中選擇動作at;若TR≤TH,選擇貪婪策略作為本時段動作,即:
f.根據動作at與混合系統(tǒng)功率偏差控制目標值的一一對應關系,得到t時段混合系統(tǒng)輸出功率偏差控制的目標值;
g.根據混合系統(tǒng)輸出功率偏差控制目標值計算儲能設備功率控制需求值
h.計算儲能設備在t時段的實際充放電功率
若t時段儲能設備的控制設定值需校驗儲能設備發(fā)出功率后,是否超出儲能設備容量下限,若超出則需修正:
式中:Es,t為t時段初始時刻儲能設備存儲電量;ηd為儲能設備的放電效率;Δt為時段持續(xù)時間;Esmin為儲能設備容量下限;為求取儲能實際輸出功率時暫存的臨時值;
若需校驗儲能設備吸收功率后,是否超出儲能設備容量上限,若超出則需修正:
式中:ηc為儲能設備的充電效率;Esmax為儲能設備容量上限;
此外,儲能設備實際輸出功率還應滿足有功功率上限約束、下限約束,若超出有功功率上限或下限,則需修正:
式中:Psmax為儲能設備有功功率上限;Psmin為儲能設備有功功率下限;為儲能設備實際輸出功率;
i.計算t時段混合系統(tǒng)實際輸出功率偏差值
式中:為t時段風電實際輸出功率;為混合系統(tǒng)向電網申報t時段計劃功率值;
j.計算t時段的立即回報值rt+1(st,at):
rt+1(st,at)=Cr(t)+Cp(t)+Ca(t)+Cc(t)
Cr(t)為備用電量費用,Cp(t)為實際使用備用超出申報備用時產生的懲罰費用,計算公式分別為:
式中:λr,t為t時段的備用電量價格;λp為混合系統(tǒng)實際使用備用超出申報備用范圍時,電網對混合系統(tǒng)的懲罰費用系數;Rh,t為混合系統(tǒng)申報的t時段備用容量;
Ca(t)為t時段混合系統(tǒng)實際控制效果達不到所設定的控制目標值設定的懲罰費用,計算公式為:
式中:kc為儲能設備功率需求值與實際值不符對應的懲罰系數;
Cc(t)為t時段儲能設備充放狀態(tài)轉變對應的懲罰:
式中:kk為頻繁充放電對應的懲罰系數;Ks,t為儲能連續(xù)充、放電持續(xù)時段數,正數表示已連續(xù)充電時段數,負數表示已連續(xù)放電時段數;Ksmax為免懲罰時段數,當儲能連續(xù)充電或放電Ksmax個時段后,改變充電、放電狀態(tài)不會受到懲罰;
k.根據Ks,t和t時段的充放電行為更新儲能設備t+1時段充放電狀態(tài)Ks,t+1:
l.識別t+1時段風儲混合系統(tǒng)所處的狀態(tài)st+1,根據動作選擇策略確定t+1時段風儲混合系統(tǒng)控制動作at+1;
m.對Q值函數進行修正:
Qt+1(st,at)=Qt(st,at)+α[rt+1(st,at)+γQt(st+1,at+1)-Qt(st,at)]
式中:Qt(st,at)為經過t-1次修正后的最優(yōu)動作值函數;α為學習因子;γ為折扣因子;
n.若達到規(guī)定的學習步數NT,訓練結束,按照Q值函數執(zhí)行貪婪策略即控制策略;若未達到規(guī)定的學習步數,t=t+1、Nn=Nn+1,轉至步驟d。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華北電力大學(保定),未經華北電力大學(保定)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710470529.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種資源處理方法及裝置
- 下一篇:用于寫入以及讀取數據集的方法





