[發(fā)明專利]一種基于深度強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)電力系統(tǒng)經(jīng)濟(jì)調(diào)度方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010972420.1 | 申請(qǐng)日: | 2020-09-16 |
| 公開(kāi)(公告)號(hào): | CN112186743B | 公開(kāi)(公告)日: | 2022-03-25 |
| 發(fā)明(設(shè)計(jì))人: | 張沛;呂曉茜;宋秉睿;李家騰;孟祥飛 | 申請(qǐng)(專利權(quán))人: | 北京交通大學(xué) |
| 主分類號(hào): | H02J3/00 | 分類號(hào): | H02J3/00;H02J3/46 |
| 代理公司: | 北京市商泰律師事務(wù)所 11255 | 代理人: | 黃曉軍 |
| 地址: | 100044 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 強(qiáng)化 學(xué)習(xí) 動(dòng)態(tài) 電力系統(tǒng) 經(jīng)濟(jì) 調(diào)度 方法 | ||
1.一種基于深度強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)電力系統(tǒng)經(jīng)濟(jì)調(diào)度方法,其特征在于:
系統(tǒng)調(diào)度周期內(nèi)的經(jīng)濟(jì)成本可表示為:
其中,ai,bi,ci為傳統(tǒng)火電機(jī)組i的成本系數(shù);Pg,i為傳統(tǒng)火力發(fā)電機(jī)i的有功出力;T為調(diào)度周期,為24小時(shí);G為系統(tǒng)中的傳統(tǒng)火力發(fā)電機(jī)數(shù)量;
根據(jù)上述模型,將一天24小時(shí)的經(jīng)濟(jì)調(diào)度分為24個(gè)決策周期的馬爾可夫過(guò)程,在每個(gè)決策階段中,通過(guò)觀察狀態(tài),做出動(dòng)作決策,并將動(dòng)作應(yīng)用于實(shí)際電力系統(tǒng)環(huán)境中,再得到從環(huán)境反饋的獎(jiǎng)懲信息與新的狀態(tài),重復(fù)這一過(guò)程,直到整個(gè)調(diào)度周期結(jié)束,決策過(guò)程的變量包括:
1)狀態(tài)st:第t個(gè)決策階段的狀態(tài)st由t+1時(shí)刻的負(fù)荷和新能源預(yù)測(cè)信息及t時(shí)刻電網(wǎng)的實(shí)時(shí)信息組成:
st={P′load,t+1,P′wind,t+1,P′pv,t+1,Pg,t,Pwind,t,Ppv,t,Pline,t,Qline,t,Vt} (8)
其中,P′load,t+1,P′wind,t+1,P′pv,t+1分別為t+1時(shí)刻的負(fù)荷預(yù)測(cè)值、風(fēng)電預(yù)測(cè)值、光伏預(yù)測(cè)值;Pg,t為傳統(tǒng)火力發(fā)電機(jī)在t時(shí)刻的實(shí)際出力值;Pwind,t和Ppv,t分別為t時(shí)刻的風(fēng)電實(shí)際出力值、光伏實(shí)際出力值;Pline,t和Qline,t分別為t時(shí)刻線路傳輸有功及無(wú)功功率;Vt為t時(shí)刻節(jié)點(diǎn)電壓幅值;
2)動(dòng)作at
第t個(gè)決策階段的動(dòng)作at定義為:
其中,為非平衡節(jié)點(diǎn)傳統(tǒng)火電機(jī)組出力動(dòng)作值;為風(fēng)電出力動(dòng)作值;為光伏出力動(dòng)作值;
依據(jù)狀態(tài)觀測(cè)值st給出動(dòng)作at后,需將動(dòng)作應(yīng)用到實(shí)際電力系統(tǒng)中,受限于傳統(tǒng)火電機(jī)組相鄰時(shí)刻爬坡約束,各傳統(tǒng)火電機(jī)組下一調(diào)度時(shí)段t+1實(shí)際出力狀態(tài)Pg,i,t+1為:
其中Pi,ramp_up和Pi,ramp_down分別為傳統(tǒng)火電機(jī)組i的最大上爬坡功率與最大下爬坡功率;
受限于新能源實(shí)際最大可發(fā)功率,新能源下一時(shí)調(diào)度時(shí)段t+1的出力值為:
其中,和分別為t+1時(shí)刻風(fēng)電與光伏的最大可發(fā)功率;
3)獎(jiǎng)勵(lì)reward
當(dāng)動(dòng)作at應(yīng)用在環(huán)境中后,需根據(jù)環(huán)境的變化反饋即時(shí)獎(jiǎng)勵(lì),供學(xué)習(xí)動(dòng)作的效果,t時(shí)刻的即時(shí)獎(jiǎng)勵(lì)由機(jī)組出力成本與懲罰函數(shù)組成:
rt=-(rcost,t+rpenal,t) (13)
其中,rcost,t為系統(tǒng)經(jīng)濟(jì)成本;rpenal,t為違反約束時(shí)的懲罰;
為實(shí)現(xiàn)新能源的優(yōu)先消納,系統(tǒng)經(jīng)濟(jì)成本中只計(jì)入傳統(tǒng)火電機(jī)組出力成本,不計(jì)新能源出力成本:
懲罰函數(shù)考慮電力系統(tǒng)運(yùn)行安全約束:
其中,k1、k2與k3均為懲罰系數(shù);Tl為線路l的傳輸視在功率;Tl,max為線路l的傳輸容量極限;Vn,t為節(jié)點(diǎn)n在t時(shí)刻的電壓幅值;Vn,min和Vn,max分別為節(jié)點(diǎn)n電壓下限與上限;
4)策略π
策略為狀態(tài)到動(dòng)作的映射,指的是給定狀態(tài)時(shí),動(dòng)作集上的一個(gè)分布,也即在每個(gè)狀態(tài)s指定一個(gè)動(dòng)作概率;
5)流程
在最開(kāi)始系統(tǒng)處于某種初始狀態(tài)s0下,系統(tǒng)根據(jù)策略π對(duì)電網(wǎng)下達(dá)動(dòng)作指令a0,確定下一階段發(fā)電機(jī)有功出力值、風(fēng)光出力,將動(dòng)作指令與環(huán)境交互,環(huán)境狀態(tài)發(fā)生改變,并反饋回給調(diào)度中心系統(tǒng)作為下一決策階段的狀態(tài)s1,計(jì)算獎(jiǎng)勵(lì)r0,循環(huán)進(jìn)行這一過(guò)程直至最后一個(gè)決策階段;
將上述馬爾可夫過(guò)程的模型采用深度強(qiáng)化學(xué)習(xí)算法求解,得到最優(yōu)的經(jīng)濟(jì)調(diào)度決策。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京交通大學(xué),未經(jīng)北京交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010972420.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H02J 供電或配電的電路裝置或系統(tǒng);電能存儲(chǔ)系統(tǒng)
H02J3-00 交流干線或交流配電網(wǎng)絡(luò)的電路裝置
H02J3-01 .減少諧波或波紋的裝置
H02J3-02 .應(yīng)用單個(gè)網(wǎng)絡(luò)以不同頻率同時(shí)配電的;應(yīng)用單個(gè)網(wǎng)絡(luò)對(duì)交流和直流同時(shí)配電的
H02J3-04 .用于連接以相同頻率但由不同電源供電的網(wǎng)絡(luò)
H02J3-10 .恒流供電系統(tǒng)
H02J3-12 .用于通過(guò)改變網(wǎng)絡(luò)負(fù)載的一個(gè)特性來(lái)調(diào)整交流網(wǎng)絡(luò)中的電壓的
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





