[發明專利]一種基于深度強化學習的需求響應控制方法在審
| 申請號: | 202010562543.8 | 申請日: | 2020-06-18 |
| 公開(公告)號: | CN111725836A | 公開(公告)日: | 2020-09-29 |
| 發明(設計)人: | 奚培鋒;張少迪;江浩;官樂樂;崔承剛;胡桐月;方文 | 申請(專利權)人: | 上海電器科學研究所(集團)有限公司;上海電器科學研究院;上海電機系統節能工程技術研究中心有限公司 |
| 主分類號: | H02J3/38 | 分類號: | H02J3/38;H02J3/46;H02J3/28;G06N3/08;G06Q50/06;G06N3/04;G06F30/27 |
| 代理公司: | 上海璀匯知識產權代理事務所(普通合伙) 31367 | 代理人: | 王文穎 |
| 地址: | 200063 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 強化 學習 需求 響應 控制 方法 | ||
1.一種基于深度強化學習的需求響應控制方法,其特征在于,包括以下步驟:
步驟1、滿足綜合能源系統的供銷平衡的前提下,將綜合能源系統最小耗能問題建模為基于馬爾可夫博弈的深度神經網絡,并設計相應的動作、環境狀態、以及獎勵函數,包括以下步驟:
步驟101、將動作的表達式設計為:
At=(PA,t,PB,t,PC,t,PD,t,PE,i,t,PH,t)
上式中,At表示t時刻的動作,PA,t表示t時刻的儲電系統的放電量,PB,t表示t時刻儲熱系統的放熱量,PC,t表示t時刻的微燃機的消耗燃氣量,PD,t表示t時刻的燃氣鍋爐的消耗燃氣量,PE,i,t表示第i個電動汽車t時刻的電動汽車充電量,PH,t表示t時刻的可中斷負荷的中斷量;
步驟102、建立綜合能源系統模型及需求響應機制,其中,綜合能源系統包括微型燃氣輪機、燃氣鍋爐、儲電裝置和儲熱裝置,并將電動汽車當作儲能裝置,參與電力調度,則有:
微型燃氣輪機模型如下式所示:
Pgas,t=PC,tLNG
式中,PMT,t表示t時刻微型燃氣輪機的發電功率,表示微型燃氣輪機的發電效率,Pgas,t表示t時刻微型燃氣輪機消耗的天然氣功率,QMT,t表示t時刻微型燃氣輪機的產熱功率,表示微型燃氣輪機的散熱損失系數,PC,t表示t時刻微型燃氣輪機消耗的燃料量,LNG表示天然氣燃燒的低熱值;
燃氣鍋爐模型如下式所示:
式中,QGB,t表示t時刻燃氣鍋爐的熱功率,PD,t表示t時刻燃氣鍋爐在消耗的燃氣量,表示燃氣鍋爐的產熱效率;
電動汽車充放電模型如下式所示:
當EVSOC,t+PG,t≤EVcapacity時,電動汽車的充電量為PG,t;
當EVSOC,t+PG,t≥EVcapacity時,電動汽車的充電量PG,t=EVcapacity-EVSOC,t;
式中,EVSOC,t為電動汽車t時刻電量,EVcapacity為電動汽車容量;
可中斷負荷模型如下式所示:
PH,min≤PH,t≤PH,max
式中,PH,min表示可中斷容量的最小值,PH,t表示t時刻可中斷容量,PH,max可中斷容量的最大值;
儲電系統充放電模型如下式所示:
當PA,t>0時,儲電系統處于放電狀態,放電狀態包括正常放電狀態及過度放電狀態,當儲電系統處于正常放電狀態時:
ESSmin<ESSSOC,t-PA,t≤ESScapacity
t時刻電網的購電量PGA,t=eledemand+PG,t-PA,t-PMT,t-Fe,t;
式中,ESSmin、ESScapacity、ESSSOC,t分別為儲電系統最低電量、儲電系統容量和儲電系統t時刻電量,eledemand為電負荷需求量,Fe,t為靈活爬坡量;
當儲電系統處于過度放電狀態時:
ESSSOC,t-PA,t≤ESSmin
t時刻電網的購電量PGA,t=eledemand+PG,t-(ESSmin-ESSSOC,t)-PMT,t-Fe,t;
當PA,t<0時,儲電系統處于充電狀態:
ESSSOC,t-PA,t≥ESScapacity
t時刻電網的購電量PGA,t=eledemand+PG,t-(ESSSOC,t-ESScapacity)-PMT,t-Fe,t;
儲熱系統蓄/放模型如下式所示:
當PB,t>0時,儲熱系統處于放熱狀態,放熱狀態包括正常放熱狀態及過度放熱狀態,當儲熱系統處于正常放熱狀態時:
HSSmin<HSSSOC,t-PB,t≤HSScapacity
t時刻的可中斷負荷的中斷量PH,t=heatdemand-PB,t-QMT,t;
式中,HSSmin為儲熱系統最低熱量,HSScapacity為儲熱系統容量,HSSSOC,t儲熱系統t時刻熱量,heatdemand,t為熱負荷需求量;
當儲熱系統處于過度放熱狀態時:
HSSSOC,t-PB,t≤HSSmin
t時刻的可中斷負荷的中斷量PH,t=heatdemand-(HSSmin-HSSSoC,t)-QMT;
當PB,t<0時,儲熱系統處于蓄熱狀態:
HSSSoC,t-PB,t≥HSScapacity
t時刻的可中斷負荷的中斷量PH,t=heatdemand-(HSSSOC,t-HSScapacity)-QMT;
步驟103、將環境狀態的表達式設計為:
St=(ΔPgrid,ΔPA,t,ΔPB,t,ΔPC,t,ΔPD,t,ΔPE,i,t)
式中,St代表t時刻環境狀態值,ΔPgrid代表t時刻與t-1時刻從電網購電價格的差值,ΔPA,t代表t時刻與t-1時刻儲電系統的電量的差值,ΔPB,t代表t時刻與t-1時刻儲熱系統的熱量的差值,ΔPC,t代表t時刻與t-1時刻微燃機的發電量的差值,ΔPD,t代表t時刻與t-1時刻燃氣鍋爐的發熱量的差值,ΔPE,t代表時刻與t-1時刻的第i個電動汽車的電動汽車充電量的差值;
步驟104、將獎勵函數reward表達式設計為:
式中,priceele,t為t時刻電網買電電價,priceheat,t為t時刻供熱價格,pricegas,t為t時刻天然氣價格,priceF,t為t時刻靈活爬坡備用價格,priceIL,t為t時刻可中斷補償價格;
馬爾科夫決策過程求解獎勵函數reward的最大值,故取耗能成本的負值,當獎勵函數reward取得最大值時,綜合能源系統的耗能成本最低;
步驟2、使用深度確定性梯度算法對步驟1建立的深度神經網絡進行訓練,深度確定性梯度算法包括actor當前策略網絡、actor目標策略網絡、critic當前Q網絡和critic目標Q網絡;
步驟3、在實際應用中,依據訓練好的深度神經網絡和新的環境狀態輸入即可獲得關于綜合能源系統中微燃機、儲電/熱裝置和燃氣鍋爐各個時刻的出力情況以及可中斷負荷的中斷容量情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海電器科學研究所(集團)有限公司;上海電器科學研究院;上海電機系統節能工程技術研究中心有限公司,未經上海電器科學研究所(集團)有限公司;上海電器科學研究院;上海電機系統節能工程技術研究中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010562543.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分布式動態點化云存儲技術
- 下一篇:一種便攜式種子分離器





