[發明專利]基于強化學習的綜合能源系統多主體運行優化方法及裝置在審
| 申請號: | 202110318894.9 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN113177655A | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 肖遷;穆云飛;賈宏杰;陸文標;李天翔;余曉丹 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06N20/00;G06Q50/06 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 強化 學習 綜合 能源 系統 主體 運行 優化 方法 裝置 | ||
1.一種基于強化學習的綜合能源系統多主體運行優化方法,其特征在于,所述方法包括:
構建園區綜合能源系統多主體模型,將多主體模型的優化過程分為上層多主體博弈與下層設備調度優化,并采用“源-荷”雙側博弈互動;
基于Stackelberg博弈定義以排列組合的形式篩選Nash均衡點,并結合Nash-Q算法獲取全時段的最優組合動作,即為當前典型日的最優策略;以各主體生產成本最小為目標函數使用CPLEX求解器求取各主體設備最優運行狀態。
2.根據權利要求1所述的一種基于強化學習的綜合能源系統多主體運行優化方法,其特征在于,所述基于Stackelberg博弈定義以排列組合的形式篩選Nash均衡點具體為:
應用強化學習中的強化信號去描述多主從博弈中納什均衡點的實際物理意義,根據強化信號判斷組合動作是否滿足任一智能體的回報約束條件,若滿足則該組合動作為一個Nash均衡解。
3.根據權利要求1或2所述的一種基于強化學習的綜合能源系統多主體運行優化方法,其特征在于,所述結合Nash-Q算法獲取全時段的最優組合動作,即為當前典型日的最優策略具體為:
1)對動作空間進行離散;
2)各智能體根據回報約束條件,去除不滿足約束的動作組合,將滿足約束的動作保留作為動作集;
3)計算動作集中所有組合動作下各智能體的收益,將收益數據存于表格中;
4)按照從智能體1至智能體n的順序選中某一智能體,分別在其余未選中的所有智能體的所有組合動作下搜索選中智能體的最優動作,并刪除本次選中的智能體的其余動作,只保留最優動作;
5)將現存的動作集中的組合動作保存,保存的組合動作即為全時段的最優策略。
4.根據權利要求3所述的一種基于強化學習的綜合能源系統多主體運行優化方法,其特征在于,所述搜索選中智能體的最優動作具體為:
選取表格中回報值最大的動作,選中過的智能體其動作集中僅有最優動作。
5.一種基于強化學習的綜合能源系統多主體運行優化裝置,其特征在于,所述裝置包括:
構建模塊,用于構建園區綜合能源系統多主體模型;
劃分與互動模塊,用于將多主體模型的優化過程分為上層多主體博弈與下層設備調度優化,并采用“源-荷”雙側博弈互動;
篩選與求解模塊,用于基于Stackelberg博弈定義以排列組合的形式篩選Nash均衡點,并結合Nash-Q算法獲取最優保存的組合動作即為當前狀態下的Nash均衡點;
求取模塊,用于以各主體生產成本最小為目標函數使用CPLEX求解器求取各主體設備最優運行狀態。
6.一種基于強化學習的綜合能源系統多主體運行優化裝置,其特征在于,所述裝置包括:處理器和存儲器,所述存儲器中存儲有程序指令,所述處理器調用存儲器中存儲的程序指令以使裝置執行權利要求1-4中的任一項所述的方法步驟。
7.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令被處理器執行時使所述處理器執行權利要求1-4中的任一項所述的方法步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110318894.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高溫陶瓷生產溫度檢測設備
- 下一篇:一種用于磁性材料進料的振動盤
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





