[發(fā)明專利]一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010820764.0 | 申請(qǐng)日: | 2020-08-14 |
| 公開(公告)號(hào): | CN112116125A | 公開(公告)日: | 2020-12-22 |
| 發(fā)明(設(shè)計(jì))人: | 邵成成;錢濤;李徐亮 | 申請(qǐng)(專利權(quán))人: | 西安交通大學(xué) |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06Q10/06;G06N3/08;G06N3/04;G06F30/20 |
| 代理公司: | 西安通大專利代理有限責(zé)任公司 61200 | 代理人: | 馬貴香 |
| 地址: | 710049 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 強(qiáng)化 學(xué)習(xí) 電動(dòng)汽車 充電 導(dǎo)航 方法 | ||
1.一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,包括以下步驟:
步驟一:采集電動(dòng)汽車充電導(dǎo)航的歷史數(shù)據(jù);
步驟二:利用確定性電動(dòng)汽車充電導(dǎo)航模型對(duì)歷史數(shù)據(jù)降維并抽取特征數(shù)據(jù);
步驟三:根據(jù)步驟二中的特征數(shù)據(jù),建立馬爾科夫決策過(guò)程模型;
步驟四:利用馬爾科夫決策過(guò)程模型,以特征數(shù)據(jù)為訓(xùn)練樣本,訓(xùn)練初始化后的深度Q值網(wǎng)絡(luò);
步驟五,根據(jù)實(shí)際的各道路數(shù)據(jù),利用完成訓(xùn)練的深度Q值網(wǎng)絡(luò),得到綜合成本最小的電動(dòng)汽車充電站選擇,再利用確定性電動(dòng)汽車充電導(dǎo)航模型,得到路線規(guī)劃。
2.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,步驟一中,歷史數(shù)據(jù)包括:各道路的平均行駛速度、各充電站的等待時(shí)間和各充電站的充電電價(jià)。
3.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,確定性電動(dòng)汽車充電導(dǎo)航模型如下:
模型約束為:
eend≥emin (4)
其中,為行駛耗能成本,為行駛時(shí)間成本,為等待時(shí)間成本,為充電耗能成本,為到充電站k充電的除等待時(shí)間成本以外的成本之和,α為單位行駛距離耗電量,λe為單位電價(jià),dij為交通節(jié)點(diǎn)i到j(luò)的距離,eend為電動(dòng)汽車最終荷電狀態(tài),eini為電動(dòng)汽車的初始荷電狀態(tài),Emax為電動(dòng)汽車的最大電池容量,emax為電動(dòng)汽車最大荷電狀態(tài),為充電站k的充電價(jià)格,vij為交通節(jié)點(diǎn)i到j(luò)的通行速度;yi為代表充電站位置的0-1變量。
4.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,步驟三中,馬爾科夫決策過(guò)程模型包括:狀態(tài)向量st、動(dòng)作向量at、狀態(tài)轉(zhuǎn)移函數(shù)f(st,at,ωt)以及收益rt,其中,ωt為隨機(jī)變量。
5.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,步驟三中,根據(jù)特征數(shù)據(jù),利用公式(9)-(11),建立馬爾科夫決策過(guò)程模型;
其中,st為狀態(tài)向量,nt為當(dāng)前地點(diǎn)、et為當(dāng)前電量,為各個(gè)充電站的特征數(shù)值向量,上標(biāo)*表示模型求解的最優(yōu)變量,at為動(dòng)作向量,k為充電站的標(biāo)號(hào),分別表示前往充電站k路徑上的第一個(gè)和第二個(gè)交通節(jié)點(diǎn),上標(biāo)true表示真實(shí)的數(shù)據(jù),rt為收益。
6.根據(jù)權(quán)利要求4或5所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,當(dāng)電動(dòng)汽車還在行駛中時(shí),收益為行駛到充電站的行駛時(shí)間成本與行駛耗能成本;當(dāng)電動(dòng)汽車到充電站后,收益為充電耗能成本與充電等待時(shí)間成本。
7.根據(jù)權(quán)利要求5所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,Q值通過(guò)下式計(jì)算:
其中,Qψ(s,a)為給定狀態(tài)s和動(dòng)作a,在神經(jīng)網(wǎng)絡(luò)參數(shù)ψ下的Q值;γ為折現(xiàn)率,k為時(shí)段數(shù),rt+k為在時(shí)段t+k下獲得的收益,上標(biāo)*表示最優(yōu)的Q函數(shù)。
8.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,步驟四中,利用梯度下降法訓(xùn)練初始化后的深度Q值網(wǎng)絡(luò)。
9.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車充電導(dǎo)航規(guī)劃方法,其特征在于,步驟五中,實(shí)際的各道路數(shù)據(jù)包括:各道路的平均行駛速度、各充電站的等待時(shí)間和各充電站的充電電價(jià)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安交通大學(xué),未經(jīng)西安交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010820764.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





