[發(fā)明專利]一種基于深度學(xué)習(xí)的列車控制方法有效
| 申請?zhí)枺?/td> | 201811150477.2 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN109204390B | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計)人: | 劉波;杜恒 | 申請(專利權(quán))人: | 交控科技股份有限公司 |
| 主分類號: | B61L27/00 | 分類號: | B61L27/00 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 100070 北京市豐臺區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 列車 控制 方法 | ||
本發(fā)明實施例公開了一種基于深度學(xué)習(xí)的列車控制方法,包括:從歷史數(shù)據(jù)中篩選得到駕駛經(jīng)驗豐富的司機駕駛列車時的司機駕駛數(shù)據(jù);根據(jù)司機駕駛數(shù)據(jù)對初始的深度網(wǎng)絡(luò)模型進行訓(xùn)練,得到訓(xùn)練好的深度網(wǎng)絡(luò)模型;將不同時刻的列車狀態(tài)輸入訓(xùn)練好的深度網(wǎng)絡(luò)模型,計算得到不同時刻的列車控制量。通過采用深度學(xué)習(xí)技術(shù)對ATO控制算法建模,不需要考慮內(nèi)在控制過程,極大地簡化了問題的復(fù)雜性;通過采用駕駛經(jīng)驗豐富的司機的駕駛數(shù)據(jù)訓(xùn)練深度網(wǎng)絡(luò)模型,輸出不同時刻的列車控制量,當(dāng)獲得新的司機駕駛數(shù)據(jù)時,對深度網(wǎng)絡(luò)模型重新進行訓(xùn)練便可得到具有新數(shù)據(jù)特征的列車控制量,能夠在保證列車的準(zhǔn)時性和停車精度的前提下,改善列車舒適度,提高乘客乘坐體驗。
技術(shù)領(lǐng)域
本發(fā)明實施例涉及軌道交通技術(shù)領(lǐng)域,具體涉及一種基于深度學(xué)習(xí)的列車控制方法。
背景技術(shù)
隨著軌道交通的迅捷發(fā)展,軌道交通客運量也迅速增加。人們在追求快捷出行的同時,也對列車舒適度提出了更高的需求。在實際應(yīng)用的ATO(Automatic TrainOperation,列車自動控制)控制算法中,多是利用PID控制算法來計算列車控制量以追蹤目標(biāo)速度,根據(jù)當(dāng)前線路條件的不同,列車控制量的值可能出現(xiàn)較大幅度變化。這會導(dǎo)致列車運行過程不平穩(wěn),列車舒適度難以有效保證。
在具備ATO功能的軌道交通線路中,列車可以由ATO控制,也可以由司機控制。通過對兩種操作模式下的駕駛數(shù)據(jù)進行對比可以得出,列車舒適度在由具有豐富駕駛經(jīng)驗司機駕駛列車時較ATO控制條件下具有更好的效果。因此,如何利用司機駕駛列車的經(jīng)驗數(shù)據(jù)設(shè)計更符合人類駕駛習(xí)慣的ATO控制算法,以此改善ATO控制條件下的列車舒適度是亟需解決的問題。
發(fā)明內(nèi)容
由于現(xiàn)有方法存在上述問題,本發(fā)明實施例提出一種基于深度學(xué)習(xí)的列車控制方法。
本發(fā)明實施例提出一種基于深度學(xué)習(xí)的列車控制方法,包括:
從歷史數(shù)據(jù)中篩選得到駕駛經(jīng)驗豐富的司機駕駛列車時的司機駕駛數(shù)據(jù);
根據(jù)所述司機駕駛數(shù)據(jù)對初始的深度網(wǎng)絡(luò)模型進行訓(xùn)練,得到訓(xùn)練好的深度網(wǎng)絡(luò)模型;
將不同時刻的列車狀態(tài)輸入所述訓(xùn)練好的深度網(wǎng)絡(luò)模型,計算得到不同時刻的列車控制量。
可選地,所述根據(jù)所述司機駕駛數(shù)據(jù)對初始的深度網(wǎng)絡(luò)模型進行訓(xùn)練,得到訓(xùn)練好的深度網(wǎng)絡(luò)模型,具體包括:
根據(jù)自編碼器或受限玻爾茲曼機的預(yù)訓(xùn)練方法,采用所述司機駕駛數(shù)據(jù)對初始的深度網(wǎng)絡(luò)模型進行訓(xùn)練,得到訓(xùn)練好的深度網(wǎng)絡(luò)模型。
可選地,所述根據(jù)所述司機駕駛數(shù)據(jù)對初始的深度網(wǎng)絡(luò)模型進行訓(xùn)練,得到訓(xùn)練好的深度網(wǎng)絡(luò)模型,具體包括:
將所述司機駕駛數(shù)據(jù)輸入初始的深度網(wǎng)絡(luò)模型,得到目標(biāo)列車控制量,根據(jù)所述目標(biāo)列車控制量計算得到各時刻的列車狀態(tài),并將各時刻的列車狀態(tài)輸入所述初始的深度網(wǎng)絡(luò)模型進行訓(xùn)練,得到訓(xùn)練好的深度網(wǎng)絡(luò)模型。
可選地,所述根據(jù)所述司機駕駛數(shù)據(jù)對初始的深度網(wǎng)絡(luò)模型進行訓(xùn)練,得到訓(xùn)練好的深度網(wǎng)絡(luò)模型,具體包括:
將所述司機駕駛數(shù)據(jù)輸入初始的深度網(wǎng)絡(luò)模型,得到當(dāng)前時刻列車的駕駛策略,并根據(jù)當(dāng)前時刻列車的駕駛策略計算代價函數(shù)中各評價部分的值;
其中,所述代價函數(shù)的評價部分包括:當(dāng)前時刻模型輸出與司機駕駛數(shù)據(jù)差異部分、當(dāng)前時刻下的駕駛策略準(zhǔn)時性部分、當(dāng)前時刻下的駕駛策略停車精度部分以及當(dāng)前時刻下的駕駛策略舒適度部分;
所述代價函數(shù)中各評價部分的值為各評價部分對應(yīng)的權(quán)重。
可選地,所述方法還包括:
若判斷獲知所述初始的深度網(wǎng)絡(luò)模型的訓(xùn)練次數(shù)小于第一閾值,則增加所述當(dāng)前時刻模型輸出與司機駕駛數(shù)據(jù)差異部分的權(quán)重;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于交控科技股份有限公司,未經(jīng)交控科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811150477.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





