[發明專利]基于勢博弈的微電網能量管理分布式多目標協同優化算法有效
| 申請號: | 201810028818.2 | 申請日: | 2018-01-12 |
| 公開(公告)號: | CN108347062B | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 曾君;王僑僑;劉俊峰 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | H02J3/38 | 分類號: | H02J3/38;H02J3/32;H02J3/46;G06N3/00;G06N3/12;G06Q10/04;G06Q50/06 |
| 代理公司: | 44245 廣州市華學知識產權代理有限公司 | 代理人: | 馮炳輝 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 博弈 微電網 多目標 求解 協同優化算法 能量管理 收益函數 多目標優化算法 多目標建模 多目標優化 分布式特性 微電網元件 系統可靠性 博弈理論 單元建模 決策變量 決策優化 決策主體 向量函數 整體利益 勢函數 最大化 迭代 建模 算法 進化 均衡 決策 保證 管理 合作 | ||
1.基于勢博弈的微電網能量管理分布式多目標協同優化算法,其特征在于,包括以下步驟:
1)微電網元件單元建模
考慮一個典型的微電網,包括光伏陣列PV/pv、風力發電機WT/wt、柴油發電機DE/de、蓄電池BA/ba、負荷LD/ld以及電動汽車EV/ev,每個元件結合相應的功率變化器、傳感器、控制器和智能開關構成可控的元件單元;每個元件單元均配備一個本地管理器LM,用于本地決策和本地管理,并且所有LM通過網絡互聯,相互之間能夠通信以實現分布式協調控制;
1.1)決策主體與決策變量
所有元件單元組成的決策主體集合N表示如式(1);
式中,n1對應光伏陣列集合PV的數量,pvn是第n組光伏陣列,n=1,2,…,n1;n2對應風力發電機集合WT的數量,wtn是第n臺風力發電機,n=1,2,…,n2;n3對應柴油發電機集合DE的數量,den是第n臺柴油發電機,n=1,2,…,n3;n4對應蓄電池集合BA的數量,ban是第n組蓄電池,n=1,2,…,n4;n5對應負荷集合LD的數量,ldn是第n個負荷,n=1,2,…,n5;n6對應電動汽車集合EV的數量,evn是第n輛電動汽車,n=1,2,…,n6;
假定待優化的時間窗口包含TN個優化時段,元件單元i在t時段的輸出功率或消耗功率即決策變量用Pit表示,i∈N,t=1,2,…,TN,用正值表示輸出功率,負值表示消耗功率;元件單元i的決策向量Pi表示如式(2);
Pi=[Pi1,Pi2,…,Pit,…,PiTN]T,i∈N (2)
1.2)元件約束
決策變量Pit受上下限約束,如式(3)所示;
元件單元i在t時段的功率上下限分別為Pti·max和Pti·min;同時,元件單元所受的其它約束gi(Pi)如式(4)所示;
gi(Pi)≤0,i∈N (4)
所有元件單元必須滿足功率平衡約束,如式(5)所示;
1.3)多目標建模
多目標函數考慮兩類:自利目標與協同目標;
自利目標指的是僅與自身決策向量相關而與其它元件單元決策向量無關的目標,且該目標表明元件單元追逐自身利益最大化;此類目標數量至少一個,設以元件單元i的收益和污染物即廢棄物排放為兩個目標,最大化收益目標為Fi1(Pi,ρ,γi),ρt為t時段的單位電價,t=1,2,…,TN,ρ為電價向量;γit為t時段的單位成本系數,t=1,2,…,TN,γi成本系數向量,如式(6)所示;
最小化污染物排放目標為Fi2(Pi,μi),μit為t時段的廢棄物排放系數,t=1,2,…,TN,μi為排放系數向量,如式(7)所示;
因ρ、γi和μi為非決策向量,在不產生誤解的情況下,Fi1(Pi,ρ,γi)和Fi2(Pi,μi)分別簡寫為Fi1(Pi)和Fi2(Pi);
協同目標指的是決策主體之間共同擁有的目標,通過相互間的信息共享實現,表征決策主體之間的互動和影響;協同目標的數量至少有一個,每個協同目標至少包含兩個決策主體;設以光伏-風機-負荷m個決策主體的協同為目標,目的是使負荷與可再生能源出力相一致以減小其波動性對微電網的影響,元件單元i的協同目標為Fi(j,k)(Pi,Pj,Pk),元件單元j的協同目標為Fj(i,k)(Pj,Pi,Pk),元件單元k的協同目標為Fk(i,j)(Pk,Pi,Pj),i,j和k分別代表光伏元件、風機元件和負荷,如式(8)所示;
此m個決策主體具有相同的協同目標形式F(i,j,k)(Pi,Pj,Pk),如式(9)所示;
式中,avgτ(Pi,Pj,Pk)為從時段τ開始的Nw時間窗內i、j與k的決策變量的平均值,Nw為滑動時間窗的長度;
2)勢博弈建模
以所有決策主體作為博弈局中人,局中人集合如式(1)所示;以元件單元i的決策向量Pi作為局中人的策略,如式(2)所示;滿足式(3)、(4)的所有決策向量Pi的集合為局中人i的策略集即策略空間Yi,如式(10)所示;
局中人i的效用函數Ui(Ps)s∈N即支付函數是一個向量函數,Ps指對局中人i的效用函數產生影響的決策向量,如式(11)所示;
max Ui(Ps)s∈N=[Fi1(Pi),-Fi2(Pi),-Fi(j,k)(Pi,Pj,Pk)] (11)
所有局中人的效用函數必須具有相同維數,但每個局中人的優化目標數量可能不同,解決的方式是:將所有優化目標分類,包括經濟性目標即收入、環境性目標即污染物排放和光伏-風機-負荷協同目標,在效用函數向量中依次排列,同種類型目標即具有相同量綱的放置在相同的位置,若無該類型目標則以0補齊;統一所有目標的形式,所有最小化目標按最大化其相反數處理,也能夠用同樣方法將所有目標轉化成最小化處理;
存在勢函數G(Ps)s∈N,如式(12)所示,滿足勢博弈定義;
至此,建立分布式多目標協同優化的勢博弈模型;
3)基于多目標優化算法的分布式博弈求解
博弈求解通過以下步驟實現:
3.1)策略評估
直接使用效用函數評估策略,效用函數是一個向量函數,每個分量為一個優化目標,采用多目標優化算法求解出pareto最優解集作為候選策略集;所述的多目標優化算法包括多目標粒子群算法即MOPSO算法和多目標遺傳算法即NSGA、NSGA-II和NSGA-III這些多目標進化類算法及其改進形式;
3.2)決策規則
局中人需要從候選策略集中選出一個策略作為下一步的策略,考慮全局功率平衡約束即式(5),確立如下原則:①可行解優先于不可行解;②可行解中非支配解優先;③不可行解中約束違背量小的解優先;
所述的約束違背量是指t時段的功率平衡約束違背量ΔPt如式(13)所示;
式中,ε是誤差限,接近0的正數;所述的可行解滿足式(13),反之為不可行解;
根據以上原則,有兩種方式選擇策略;方式一:隨機選擇,從候選策略集中隨機選擇一個策略作為下一步的策略;方式二:將效用函數的各個分量即歸一化線性加權組合得到決策函數Fi(Pi),使決策函數取最大值的策略Pi*作為下一步的策略,如式(14)所示,αi1,αi2和βi(j,k)分別為對應目標函數Fi1(Pi),Fi2(Pi)和Fi(j,k)(Pi,Pj,Pk)的加權系數;
3.3)調整機制,即策略更新
調整機制分為靜態調整和動態調整;
所述的靜態調整指的是所有局中人選定下一步的策略后并不立即更新自己的策略,待所有局中人結束本輪博弈之后再更新策略;局中人通過通信獲得的其他局中人的策略均是上一輪博弈所確定的策略;
所述的動態調整指的是局中人確定下一步策略之后立即更新自己的策略,局中人通過通信獲得的其他局中人的策略均是最新的策略。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810028818.2/1.html,轉載請聲明來源鉆瓜專利網。





