[發(fā)明專利]基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)柔性負(fù)荷實(shí)時(shí)調(diào)控方法和裝置有效
| 申請?zhí)枺?/td> | 202011389959.0 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112488531B | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 肖云鵬;蔡秋娜;關(guān)玉衡;張?zhí)m;白楊;劉思捷 | 申請(專利權(quán))人: | 廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/06;G06N3/08;G06K9/62;G06F30/27;H02J3/00;H02J3/14 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 蘇云輝 |
| 地址: | 510600 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 強(qiáng)化 學(xué)習(xí) 柔性 負(fù)荷 實(shí)時(shí) 調(diào)控 方法 裝置 | ||
本申請公開了一種基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)柔性負(fù)荷實(shí)時(shí)調(diào)控方法和裝置,首先,針對不同類型的異構(gòu)柔性負(fù)荷,分別建立單一柔性負(fù)荷模型,然后針對不同參數(shù)異構(gòu)的多個(gè)柔性負(fù)荷建立聚合負(fù)荷模型,從而得到異構(gòu)柔性負(fù)荷參與需求響應(yīng)時(shí)的馬爾科夫決策過程,并通過深度強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)框架基于歷史數(shù)據(jù)對聚合體的決策函數(shù)進(jìn)行訓(xùn)練,得到異構(gòu)柔性負(fù)荷聚合體的實(shí)時(shí)優(yōu)化調(diào)控決策模型,從而得到聚合負(fù)荷實(shí)時(shí)調(diào)控的最優(yōu)策略,提高了用戶側(cè)的柔性負(fù)荷響應(yīng)能力。解決了現(xiàn)有的負(fù)荷調(diào)控方式用戶側(cè)柔性負(fù)荷的響應(yīng)能力低,難以激發(fā)用戶側(cè)的需求響應(yīng)潛力的技術(shù)問題。
技術(shù)領(lǐng)域
本申請涉及電力系統(tǒng)負(fù)荷調(diào)控技術(shù)領(lǐng)域,尤其涉及一種基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)柔性負(fù)荷實(shí)時(shí)調(diào)控方法和裝置。
背景技術(shù)
隨著大量不同的需求側(cè)柔性負(fù)荷廣泛接入并參與電網(wǎng)調(diào)控,柔性負(fù)荷異構(gòu)特性逐漸凸顯,異構(gòu)性的處理成為實(shí)際調(diào)控應(yīng)用的關(guān)鍵問題。異構(gòu)負(fù)荷又被區(qū)分為類型和參數(shù)兩種異構(gòu)方式,通常不同種類的負(fù)荷構(gòu)成類型異構(gòu),相同種類但固有參數(shù)不同的負(fù)荷構(gòu)成參數(shù)異構(gòu),對異構(gòu)柔性負(fù)荷的建模是柔性負(fù)荷調(diào)控的基礎(chǔ)。
常規(guī)的負(fù)荷調(diào)控以既定物理參數(shù)對異構(gòu)負(fù)荷建模,進(jìn)而根據(jù)參數(shù)的相似性聚類劃分成同構(gòu)群或等效群進(jìn)行目標(biāo)優(yōu)化和統(tǒng)一調(diào)度,但是難以避免多樣性異構(gòu)設(shè)備物理參數(shù)復(fù)雜的問題。例如針對溫控型負(fù)荷,常規(guī)方法主要基于負(fù)荷的動態(tài)溫度特性和周期性運(yùn)行方式,建立溫控型負(fù)荷的一階熱力學(xué)模型,但是由于負(fù)荷種類繁多、參數(shù)差異化嚴(yán)重、調(diào)控所依賴的感知和交互信息多元,導(dǎo)致用戶側(cè)柔性負(fù)荷的響應(yīng)能力降低,難以激發(fā)用戶側(cè)的需求響應(yīng)潛力。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)柔性負(fù)荷實(shí)時(shí)調(diào)控方法和裝置,用于解決現(xiàn)有的負(fù)荷調(diào)控方式用戶側(cè)柔性負(fù)荷的響應(yīng)能力低,難以激發(fā)用戶側(cè)的需求響應(yīng)潛力的技術(shù)問題。
有鑒于此,本申請第一方面提供了一種基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)柔性負(fù)荷實(shí)時(shí)調(diào)控方法,包括:
對電力系統(tǒng)不同類型的異構(gòu)柔性負(fù)荷分別建立單一柔性負(fù)荷動態(tài)模型,得到單一柔性負(fù)荷的狀態(tài)變量、動作變量、環(huán)境變量和回報(bào)函數(shù);
根據(jù)所有單一柔性負(fù)荷的所述狀態(tài)變量、動作狀態(tài)變量、環(huán)境變量和回報(bào)函數(shù),建立異構(gòu)柔性負(fù)荷聚合模型,所述異構(gòu)柔性負(fù)荷聚合模型包括聚合負(fù)荷的狀態(tài)變量、狀態(tài)空間、動作變量、動作空間和狀態(tài)轉(zhuǎn)移函數(shù);
將所述聚合模型應(yīng)用到電力系統(tǒng)實(shí)時(shí)調(diào)控環(huán)境下,得到聚合負(fù)荷參與實(shí)時(shí)響應(yīng)的回報(bào)函數(shù);
建立聚合負(fù)荷實(shí)時(shí)調(diào)控深度強(qiáng)化學(xué)習(xí)模型,根據(jù)所述聚合負(fù)荷的狀態(tài)變量、動作變量、狀態(tài)轉(zhuǎn)移函數(shù)和參與實(shí)時(shí)響應(yīng)的回報(bào)函數(shù),對所述聚合負(fù)荷實(shí)時(shí)調(diào)控深度強(qiáng)化學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到柔性負(fù)荷聚合的實(shí)時(shí)優(yōu)化調(diào)控決策模型;
將目標(biāo)聚合負(fù)荷的狀態(tài)變量輸入柔性負(fù)荷聚合的實(shí)時(shí)優(yōu)化調(diào)控決策模型,得到聚合負(fù)荷實(shí)時(shí)調(diào)控的最優(yōu)策略。
可選地,所述單一柔性負(fù)荷動態(tài)模型包括負(fù)荷溫控動態(tài)函數(shù)、用戶不適度函數(shù)和回報(bào)函數(shù)。
可選地,所述異構(gòu)柔性負(fù)荷聚合模型為:
s(t+1)=Ftransition(s(t),a(t),w(t))
其中,s(t+1)為t+1時(shí)刻聚合負(fù)荷的狀態(tài)變量,s(t)為t時(shí)刻聚合負(fù)荷的狀態(tài)變量,a(t)為t時(shí)刻聚合負(fù)荷的動作變量,w(t)為t時(shí)刻的環(huán)境變量,Ragg(t)為聚合負(fù)荷在t時(shí)刻的回報(bào)函數(shù),rDR(t)為t時(shí)刻聚合負(fù)荷參與需求響應(yīng)的總收益,為總用戶不適度,λ(t)(Pagg(t)-Pbase(t))Δt為電費(fèi)支出減少量。
可選地,所述聚合負(fù)荷實(shí)時(shí)調(diào)控深度強(qiáng)化學(xué)習(xí)模型采用深度Q值網(wǎng)絡(luò)算法訓(xùn)練。
可選地,所述深度強(qiáng)化學(xué)習(xí)模型的損失函數(shù)為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心,未經(jīng)廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011389959.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





