[發明專利]一種基于蒙特卡洛方法的電動車智能充電優化方法和系統有效
| 申請號: | 202011286676.3 | 申請日: | 2020-11-17 |
| 公開(公告)號: | CN112428834B | 公開(公告)日: | 2022-06-21 |
| 發明(設計)人: | 陳征 | 申請(專利權)人: | 寧波工程學院 |
| 主分類號: | B60L53/00 | 分類號: | B60L53/00;G06F17/15 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 趙悅 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 蒙特卡洛 方法 電動車 智能 充電 優化 系統 | ||
1.一種基于蒙特卡洛方法的電動車智能充電優化方法,其特征在于,包括以下步驟:
S1對所有的電動車充電狀況s設置一任意策略π(s);
S2將開始時刻的狀態s0和行動a0帶入初始化策略π0(s)獲得序列:s0,a0,R1,…,sT-1,aT-1,RT,Ri為i時刻能量的即時消耗;
S3根據S2中的所述序列獲得i時刻狀況si和行動ai對應的G值;
S4若狀態st和行動at在所述序列中出現過,則記錄其G值中,遍歷所有待測狀態和行動,獲得所有在所述序列中出現過的狀態和行動對應的G值;
S5將所有的G值取平均值獲得行動值函數值Q(s,a);
S6重復步驟S1-S5,選取不同的策略π(s)并獲得與其對應的行動值函數值Q(s,a);其中行動值函數值Q(s,a)最大時對應的策略π(s)為最優策略。
2.如權利要求1所述的基于蒙特卡洛方法的電動車智能充電優化方法,其特征在于,所述步驟S2中能量的即時消耗的公式為:
其中,Ech(SoC(t))表示[t,t+1]時間段內的充電樁充給電動車的電能,η是充電效率系數,g表示當能耗超過電池可用電能時候的油耗。
3.如權利要求2所述的基于蒙特卡洛方法的電動車智能充電優化方法,其特征在于,所述步驟S3中G值的計算公式:
Gt=γGt-1+Rt+1
其中,γ為折扣因子,為常數,G0=0。
4.如權利要求3所述的基于蒙特卡洛方法的電動車智能充電優化方法,其特征在于,所述步驟S5中行動值函數值Q(s,a)的計算公式:
其中,T為時間段[0,M]插入的T個等分點,Eπ[]為采用策略π在時間段[0,M]中消耗的電能。
5.如權利要求4所述的基于蒙特卡洛方法的電動車智能充電優化方法,其特征在于,所述步驟S6中獲得的最優策略帶入下式得到最優能耗:
其中,b(t)是Boolean值函數,當汽車在充電站時等于1,不在充電站時等于0;k表示汽油能量轉化為電能的適當系數;Et表示[t,t+1]時間段內消耗的電能;En表示車輛電池的名義容量。
6.一種基于蒙特卡洛方法的電動車智能充電優化系統,其特征在于,包括:
策略設定模塊,用于對所有的電動車充電狀況s設置一任意策略π(s);
序列模塊,用于將開始時刻的狀態s0和行動a0帶入初始化策略π0(s)獲得序列:s0,a0,R1,…,sT-1,aT-1,RT,Ri為i時刻能量的即時消耗;
G值模塊,用于根據S3中的所述序列獲得i時刻狀況si和行動ai對應的G值;
記錄模塊,用于若狀態st和行動at在所述序列中出現過,則記錄其G值中,遍歷所有待測狀態和行動,獲得所有在所述序列中出現過的狀態和行動對應的G值;
行動值函數值計算模塊,用于將所有的G值取平均值獲得行動值函數值Q(s,a);
循環輸出模塊,選取不同的策略π(s)并獲得與其對應的行動值函數值Q(s,a);其中行動值函數值Q(s,a)最大時對應的策略π(s)為最優策略。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波工程學院,未經寧波工程學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011286676.3/1.html,轉載請聲明來源鉆瓜專利網。





