[發明專利]基于群智能強化學習的電網最優碳能復合流獲取方法有效
| 申請號: | 201510369060.5 | 申請日: | 2015-06-26 |
| 公開(公告)號: | CN105023056B | 公開(公告)日: | 2018-10-30 |
| 發明(設計)人: | 張孝順;郭樂欣;余濤;王思橦;譚敏 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/06 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 羅觀祥 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 智能 強化 學習 電網 最優 復合 獲取 方法 | ||
1.一種基于群智能強化學習的電網最優碳能復合流獲取方法,其特征在于,步驟如下:
S1、根據電網負荷節點系統構建群智能強化學習系統,然后建立群智能強化學習系統的多目標最優碳能復合流模型目標函數;
S2、在群智能強化學習系統群體的主體更新迭代過程中,根據步驟S1中建立的多目標最優碳能復合流模型目標函數,設置獎勵函數;
S3、按照負荷消耗的能量的差別,把負荷離散化劃分成不同的斷面,根據斷面負荷消耗的能量值確定每個主體i的狀態si,然后根據多步回溯Q(λ)學習的資格跡來更新每個主體i的Qi值矩陣;
S4、計算每個主體i的貪婪動作aig;
S5、根據步驟S3每個主體i更新后的Qi值矩陣,再更新每個主體i的動作概率矩陣Pi;
S6、根據步驟S5每個主體i更新后的動作概率矩陣Pi,隨機選擇每個主體i當前狀態sik下的預判動作aikp,其中k為群體的當前迭代次數;
S7、根據負荷值確定的狀態s,并協同輸入多個主體,將貪婪動作aig視為各主體i最優動作,然后求解群體最優動作aib;
S8、根據步驟S6得到的每個主體i當前狀態sik下的預判動作aikp以及步驟S7求解得到的群體最優動作aib,更新得到修正后的動作值aik:
其中為每個主體i的動作修正偏差,c1、c2為學習因子,r1和r2是權重系數;
S9、確定群智能強化學習系統的控制變量矩陣,然后結合步驟S8更新得到群體中各主體i修正后的動作值aik進行潮流計算;進入步驟S10;
S10、潮流計算后,判斷每個主體i的Qi值矩陣是否收斂,即Qi值矩陣是否在本次潮流計算過程中保持不變;
若是,則將群體最后一次潮流計算得到的結果作為電網最優碳能復合流;
若否,則回到步驟S2,并且將群體的當前迭代次數加1。
2.根據權利要求1所述的基于群智能強化學習的電網最優碳能復合流獲取方法,其特征在于,所述步驟S1中群智能強化學習系統多目標最優碳能復合流模型目標函數為:
min[μ1f1(x)+μ2f2(x)+(1-μ1-μ2)Vd];
其中x為控制變量,f1(x)為非線性函數描述的碳排放損耗分量,f2(x)為非線性函數描述的有功網損分量;Vd為電網負荷節點系統中電壓穩定分量;μ1、μ2為權重系數,μ1∈[0,1],μ2∈[0,1],μ1+μ2≤1;
其中電網負荷節點系統中電壓穩定分量Vd為:
其中n為電網負荷節點系統中負荷節點的數量,Vj為負荷節點j的負荷節點電壓,Vjmax和Vjmin分別是負荷節點j的最大、最小電壓限制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510369060.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





