[發明專利]基于深度強化學習的含氫儲能微網優化運行方法有效
| 申請號: | 202110471604.4 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113095715B | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | 朱振山;翁智敏;葉成濤;陳哲盛;鄭海林;吳詩雨 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06N3/04;G06N3/08;G06F30/20 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 丘鴻超;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 強化 學習 含氫儲能微網 優化 運行 方法 | ||
1.一種基于深度強化學習的含氫儲能微網優化運行方法,其特征在于:利用線性插值法建立電解槽效率特性模型,并將電解槽效率特性模型與微型燃氣輪機、電化學儲能、儲氫罐和燃料電池模型相結合,以最小化微網運行成本為目標,構建含氫儲能微網優化運行模型;并采用深度確定性策略梯度算法求解微網優化運行決策問題,包括以下步驟:
步驟S1:計算電解槽效率與輸入功率,獲取電解槽效率特性數據,利用查表線性插值的方法構建電解槽效率特性模型,具體包括:
步驟S11:計算電解槽效率特性:
電解槽效率ηel由電壓效率ηv和電流效率ηi兩部分組成:
ηel=ηiηv
ηv=(Utn/Uel)*100%
式中:I為電解槽的堆棧電流;Utn為理論分解電壓;Uel為電解電壓;
其中,電解電壓由以下式子算出:
Urev(T,p)=1.5184-1.5421×10-3T+9.523×10-5TlnT+9.84×10-8T2
Uohm=IRi
式中:T為電解槽工作溫度;Urev為電解水的可逆電壓;Uohm為電解質自身電阻產生的電阻壓降;依次為電解水產生的氫超電勢、氧超電勢;Ri為電解質電阻;R為普適氣體常數,F為法拉第常數;αc為陰極的電荷傳遞系數,αa為陽極的電荷傳遞系數;jco為陰極的交換電流密度,jao為陽極的交換電流密度;nc為陰極的電子轉移數,na分別為陽極的電子轉移數;
電解槽輸入功率由以下式子算出:
Pel=UelI;
步驟S12:構建基于查表線性插值法的電解槽效率特性模型:
取若干個計算出的功率效率數據對作為原始數據,形成數據表;通過查表以及線性插值的方式求出對應的電解槽效率:
式中,P0、P1分別為查表時數據表中離Pel最近的兩個功率;η0為P0在數據表中對應的電解槽效率,η1為P1在數據表中對應的電解槽效率;
步驟S2:以最小化微網運行成本為目標,構建由光伏發電裝置、微型燃氣輪機、電化學儲能以及電解槽、儲氫罐和燃料電池組成的氫儲能系統的含氫儲能微網優化運行模型;
步驟S3:利用深度確定性策略梯度算法優化微網運行成本,具體包括:
步驟S31:確定狀態空間和動作空間:
微網優化運行的狀態空間參數包括光伏實時發電功率PtPV、實時用電負荷Ptload、電化學儲能的實時荷電狀態氫儲罐的儲氫狀態
式中,st表示t時刻微網狀態;
電化學儲能充放電功率通過SOC約束和額定功率算出;
微網運行優化的動作空間用微型燃氣輪機出力PtMT和氫儲能系統充放電功率表示:
式中,at表示t時刻動作;
步驟S32:設計獎勵值:
將約束條件轉換為獎勵函數的一部分:
D2=2(Ptcurt+Ptloss)
rt=-Ft-D2+D1
其中:
Cbat(t)=cbat|Ptb|
Cel(t)=celPtel
Cfc(t)=cfcPtfc
式中,D1為氫儲能SOC罰函數;表示氫儲能SOC的上限,表示氫儲能SOC的下限,D2表示失負荷和棄光成本;Ptcurt為t時刻棄光功率,Ptloss為t時刻失負荷功率;rt為t時刻獎勵,Ft為t時刻微網運行成本;CMT(t)為t時刻微型燃氣輪機的運行成本;為t時刻微型燃氣輪機的CO2排放成本;Cbat(t)為電化學儲能的運維成本,Cel(t)為電解槽的運維成本,Cfc(t)為燃料電池的運維成本;cbat為電化學儲能的運維成本系數,cel為電解槽的運維成本系數,cfc為燃料電池的運維成本系數;為燃氣輪機CO2排放系數;為碳交易市場碳排放價格;Ptb為t時刻電化學儲能的充放電功率;Ptel為t時刻電解槽功率、Ptfc為t時刻燃料電池功率;
步驟S33:利用深度確定性策略梯度算法優化微網運行成本:
首先確定迭代次數和調度周期長度,初始化深度確定性策略梯度算法超參數,然后,選擇微網初始狀態,根據策略網絡選擇動作并疊加噪聲,根據動作計算電化學儲能功率,執行動作,觀察當前獎勵,并將當前狀態、動作、獎勵、下一時刻狀態存儲至經驗池;最后,選取樣本,根據更新公式更新策略網絡和評價網絡及目標網絡并更新狀態,重復至調度周期結束,開始下一輪迭代。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110471604.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種量子化生物種群數量估計方法
- 下一篇:一種粗糠樹組織培養快速生根的方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





