[發明專利]一種自適應不確定性的電力系統動態經濟調度方法在審
| 申請號: | 202210560992.8 | 申請日: | 2022-05-23 |
| 公開(公告)號: | CN114897388A | 公開(公告)日: | 2022-08-12 |
| 發明(設計)人: | 汪旸;王春明;廖思陽;朱可凡;魏聰穎;徐箭;劉亦朋 | 申請(專利權)人: | 國家電網公司華中分部;武漢大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/06;H02J3/00;H02J3/46 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 許蓮英 |
| 地址: | 430070 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自適應 不確定性 電力系統 動態 經濟 調度 方法 | ||
1.一種自適應不確定性的電力系統動態經濟調度方法,其特征在于,包括以下步驟:
步驟1,導入電力系統中每個調度時段的狀態變量,所述電力系統每個調度時段的狀態變量包括每個調度時段的發電機組狀態變量、每個調度時段的新能源狀態變量、每個調度時段的負荷狀態變量;得到的數據包含了所有調度時間段的狀態,調度日數為D,以每個調度日作為一個調度周期,每個調度周期包含了T個調度時段;以下表述某個調度時段t的狀態空間表述方法:
首先需要觀測發電機組的出力值、向上備用容量、向下備用容量,N臺發電機組的狀態空間可用下式歸納:
sG,t=(P1,t,P2,t…PN,t,U1,t,U2,t…UN,t,D1,t,D2,t…DN,t)
式中,下標中t表示第t個調度時刻,sG,t表示發電機組狀態空間,下標數字1,2,…N代表發電機編號,P代表功率,U代表發電機向上備用容量,D代表發電機向下備用容量;
其次對于具有隨機性的光伏出力、風電出力、負荷,不僅考慮了其實時值的大小,還考慮了其時序相關性而引入其一次導數和二次導數:
sM,t=(PPV,t,PWT,t,PL,t,PPV,d1,t,PWT,d1,t,PL,d1,t,PPV,d2,t,PWT,d2,t,PL,d2,t)
式中,下標中t表示第t個調度時刻,sM,t表示第t個調度時段的隨機狀態空間,PPV,t為第t個調度時段光伏出力,PWT,t為第t個調度時段風機出力,PL,t為第t個調度時段負荷需求;下標中d1表示一次導數,d2表示二次導數,第t個調度時段的一次導數和二次導數求解方法如下:
PPV,d1,t=PPV,t-PPV,t-1
PPV,d2,t=PPV,t-2PPV,t-1+PPV,t-2
PWT,d1,t=PWT,t-PWT,t-1
PWT,d2,t=PWT,t-2PWT,t-1+PWT,t-2
PL,d1,t=PL,t-PL,t-1
PL,d2,t=PL,t-2PL,t-1+PL,t-2
式中PPV,t為第t個調度時段光伏出力,PWT,t為第t個調度時段風機出力,PL,t為第t個調度時段負荷需求;PPV,t-1為第t-1個調度時段光伏出力,PWT,t-1為第t-1個調度時段風機出力,PL,t-1為第t-1個調度時段負荷需求;PPV,d1,t為第t個調度時段光伏出力的一次導數,PWT,d1,t為第t個調度時段風機出力的一次導數,PL,d1,t為第t個調度時段負荷需求的一次導數,PPV,d2,t為第t個調度時段光伏出力的二次導數,PWT,d2,t為第t個調度時段風機出力的二次導數,PL,d2,t為第t個調度時段負荷需求的二次導數
則獲取的維數為(3N+9)的狀態空間最終可以表示為:
st={sG,t,sM,t}
式中,st為第t個調度時刻狀態空間,sG,t為第t個調度時刻發電機組狀態空間,sM,t表示第t個調度時段的隨機狀態空間;
步驟2,初始化策略網絡和Q值網絡,包括了:原策略網絡參數θQ,目標策略網絡參數θQ',原Q值網絡參數θμ,目標Q值網絡參數θμ',設定學習迭代次數K,確定調度周期長度T,初始化經驗池,設定動作-學習比例Z;初始迭代次數k=0,調度時段t=0;確定折扣因子γ∈[0,1];
步驟3,初始化電力系統狀態.隨機選擇一個調度日的第一個調度時段t=0初始化狀態空間s0;迭代次數k=k+1;
步驟4,根據策略網絡輸出決策動作值,并以探索性動作機制執行實際動作值,調度時段t=t+1;實際動作值可用下式表示:
其中,是策略網絡采取的實際動作,由常規發電機組功率調整值以及向上備用調整值向下備用調整值組成,at是輸出的決策動作,n為隨機噪聲,p為隨著迭代次數逐漸衰減的噪聲占比;
步驟5,根據策略網絡采取的實際動作計算即時獎勵rt;即時獎勵rt可由下式給出:
rt=-0.05(FG,t+FR,t+FS,t)
式中FG,t為發電機組在第t個調度時段的常規發電機成本,FR,t為發電機組在第t個調度時段的備用成本,FS,t為發電機組在第t個調度時段的隨機性成本;具體為:
其中,下標中t表示第t個調度時段,對于第t個調度時段:hi為第i個機組對應的常數項成本系數,bi為第i個機組對應的一次項成本系數,ci為第i個機組對應的二次項成本系數,模型內考慮有N個常規機組;
備用成本為系統預旋轉備用產生的成本:
式中,下標中t表示第t個調度時段,對于第t個調度時段:FR,t為備用成本,Ui,t為第i個發電機的向上備用容量,Di,t為第i個發電機的向上備用容量,kU為向上備用成本系數,kD為向下備用成本系數;
隨機性成本充分考慮了電力系統的不確定性,是由光伏以及風電出力的預測誤差造成的,預測誤差造成的功率差額可由旋轉備用彌補,但超出備用裕量時會導致切負荷或是棄風、棄光現象:
FS,t=(cUPU,t+cDPD,t)+(cLPL,t+cAPA,t)t
式中,下標中t表示第t個調度時段,對于第t個調度時段:FS,t為隨機性成本,PU,t是向上備用功率,PD,t是向下備用功率,PL,t是被切除負荷,PA,t是棄風棄光總功率分,cU是向上備用成本系數,cD是向下備用成本系數,cL是被切除負荷成本系數,cU是棄風棄光成本系數;
步驟6,根據第t個調度時段策略網絡采取的實際動作值和狀態空間st={sG,t,sM,t},確定下一個調度時段狀態空間st+1;下一個調度時段狀態空間st+1的發電機狀態可由下式表示:
st+1={sG,t+1,sM,t+1}
其中,sM,t+1為第t+1調度時段的隨機狀態空間,sG,t+1為第t+1調度時段發電機狀態;第t+1調度時段發電機狀態sG,t+1由第t個調度時段狀態st和第t個調度時段采取的實際動作值決定:
步驟7,由步驟3-5得到狀態轉移過程;狀態轉移過程可由下式表述:
{st,at,rt,st+1}
式中,st為第t個調度時段的狀態空間,at為第t個調度時段策略網絡的輸出動作值,rt為第t個調度時段的即時獎勵,st+1是第t+1個調度時段的狀態空間;
記錄到經驗池中,完成一次經驗回收;利用動作-學習比例機制,每回收Z次進行一次學習,Z為設定好的動作-學習比例,作為優選,當Z=4時,每產生4次動作,即產生了4次經驗,而學習一次;學習是指更新神經網絡參數,具體為如下步驟:
步驟7.1,更新原Q值網絡:
其中,θQ為原Q值網絡的網絡參數,αQ為原Q值網絡的學習率,為梯度計算函數,L(θQ)為損失函數;損失函數L(θQ)具體為:
L(θQ)=E(yt-Q(st,at|θQ)2)
式中E(·)為數學期望函數,st為第t個調度時段狀態空間,at|θQ為在原Q值網絡參數為θQ條件下第t個調度時段原Q值網絡的輸出動作值,yt為目標Q值,Q(st,at)為動作-值函數;目標Q值yt可由下式計算:
yt=rt+γQ(st+1,μ′(st+1|θμ′)|θQ′);
式中rt為第t個調度時段的即時獎勵,γ為折扣因子,θμ′為目標策略網絡參數,θQ′為目標Q值網絡參數;μ′(st)表示在第t個調度時段條件下,目標網絡輸出的動作值,定義為:
前述式中,動作-值函數Q(st,at)可由下式定義:
式中,t表示第t個調度時段,st為第t個調度時段狀態空間,at為第t個調度時段策略網絡的輸出動作值,E(·)為數學期望函數,T為調度周期長度,γ為折扣因子,rt+m(st+m,at+m)為第t+m個調度時段的即時獎勵;
步驟7.2,更新原策略網絡:
式中,θμ為原策略網絡的網絡參數,αμ為原策略網絡的學習率,為梯度計算函數,μ為原策略網絡輸出的動作;計算方法為:
其中,下標t表示第t個調度時段,為梯度計算函數,s為狀態空間,θQ為原Q值網絡參數,θμ為原策略網絡參數,a|θQ為在原Q值網絡參數為θQ條件下的原Q值網絡參數輸出動作值;μ(s)表示原網絡輸出的動作值,定義為:前述式中,動作-值函數Q(st,at)可由下式定義:
步驟7.3,更新目標網絡:
其中,θμ′為目標策略網絡參數,θQ′為目標Q值網絡參數,θQ為原Q值網絡參數,θμ為原策略網絡參數,τ為軟更新模式下的網絡更新速度,一般遠遠小于1;軟更新模式導致目標網絡更新很慢,好處是學習的穩定性增強,更易于收斂;
步驟8,若調度時段t小于調度周期T,則返回第4步;
步驟9,若動作次數k小于設定學習迭代次數K,則返回步驟3;否則,訓練結束,輸出訓練后的模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網公司華中分部;武漢大學,未經國家電網公司華中分部;武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210560992.8/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





