[發明專利]一種電熱耦合系統調度方法、裝置、電子設備及其存儲介質在審
| 申請號: | 202110989053.0 | 申請日: | 2021-08-26 |
| 公開(公告)號: | CN113779871A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 孫宏斌;王宣元;席嫣娜;郭慶來;寧卜;張浩;張宏宇;王彬;劉慶時;趙昊天;劉蓁;韋凌霄;潘昭光 | 申請(專利權)人: | 清華大學;國網冀北電力有限公司;國網北京市電力公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06N3/04;G06N3/08;G06N20/00;G06Q10/06;G06Q50/06;G06F113/14;G06F119/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 吳婷 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電熱 耦合 系統 調度 方法 裝置 電子設備 及其 存儲 介質 | ||
1.一種電熱耦合系統調度方法,其特征在于,包括:
步驟1,構建一個用于電熱耦合系統調度的強化學習網絡;
步驟2,實時采集電熱耦合系統中的量測數據,對所述強化學習網絡進行訓練,更新強化學習網絡中的參數;
步驟3,利用訓練好的強化學習網絡,根據實時采集的量測數據輸出動作,對電熱耦合系統進行控制。
2.根據權利要求1所述的電熱耦合系統調度方法,其特征在于,所述的用于電熱耦合系統調度的強化學習網絡,包括生成器μ和評價器Q,其中:
(a)生成器μ的表達式為at=μ(
其中,為管道進行空間差分后存在溫度量測的微元的溫度構成的向量,為Tpipe的真子集,Tpipe代表管道進行空間差分后各管道微元的溫度構成的向量,Tin代表所有建筑物室內溫度構成的向量,Ta代表室外建筑物環境溫度,c代表電價,h代表熱源輸出功率,t代表控制過程中的離散時間變量,Π代表附加記憶參數,(·)t代表在t控制時刻的取值;
生成器的輸出為電熱耦合系統在量測信息ot下需要執行的控制策略的動作向量:
at=(m,Ts,am)
其中,m為所有管道質量流量構成的列向量,Ts為熱源供熱溫度,am為決定是否將當前觀測和動作存儲至記憶體中的變量;
生成器μ的具體結構如下:
生成器μ的輸入層包含No個神經元,其中No為量測向量ot的維度;
生成器μ的隱含層包含b1個隱含層,隱含層的個數b1、每一層隱含層的神經元數目、激活函數根據人工經驗或計算精度要求反復試探來確定,隱含層的激活函數為ReLU;
生成器μ的輸出層包含Na個神經元,其中Na為動作向量at的維度,輸出層的激活函數為tanh激活函數;
(b)評價器Q的表達式為其中θQ為評價器Q的模型參數,評價器Q的輸入為ot和at,評價器Q的輸出為在量測值為ot時執行動作at的評價值
評價器Q的結構如下:
評價器Q的輸入層包含(No+Na)個神經元;
評價器Q的隱含層包含b2個隱含層,隱含層的個數b2、每一層隱含層的神經元數目、激活函數根據人工經驗或計算精度要求反復試探來確定,隱含層的激活函數為ReLU;
評價器Q的輸出層包含1個神經元,輸出層的激活函數為線性激活函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學;國網冀北電力有限公司;國網北京市電力公司,未經清華大學;國網冀北電力有限公司;國網北京市電力公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110989053.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:接觸端子、電連接器及電子設備
- 下一篇:板對板連接器及電子設備





