[發(fā)明專(zhuān)利]一種依托強(qiáng)化學(xué)習(xí)的鉸接車(chē)軌跡跟蹤控制方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202310572466.8 | 申請(qǐng)日: | 2023-05-22 |
| 公開(kāi)(公告)號(hào): | CN116300977B | 公開(kāi)(公告)日: | 2023-07-21 |
| 發(fā)明(設(shè)計(jì))人: | 段京良;陳良發(fā);劉童;肖禮明;閆昊琪;高路路;馬飛 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京科技大學(xué) |
| 主分類(lèi)號(hào): | G05D1/02 | 分類(lèi)號(hào): | G05D1/02 |
| 代理公司: | 北京市廣友專(zhuān)利事務(wù)所有限責(zé)任公司 11237 | 代理人: | 張仲波 |
| 地址: | 100083*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 依托 強(qiáng)化 學(xué)習(xí) 鉸接 軌跡 跟蹤 控制 方法 裝置 | ||
1.一種依托強(qiáng)化學(xué)習(xí)的鉸接車(chē)軌跡跟蹤控制方法,其特征在于,所述方法包括:
S1、獲取待控制鉸接車(chē)的車(chē)輛狀態(tài)以及環(huán)境觀測(cè)量;
S2、將所述車(chē)輛狀態(tài)以及環(huán)境觀測(cè)量輸入到構(gòu)建好的鉸接車(chē)軌跡跟蹤最優(yōu)控制模型;
S3、根據(jù)所述車(chē)輛狀態(tài)、環(huán)境觀測(cè)量以及鉸接車(chē)軌跡跟蹤最優(yōu)控制模型,得到每個(gè)時(shí)間步的車(chē)輛狀態(tài),實(shí)現(xiàn)鉸接車(chē)軌跡跟蹤控制;
所述S2中的鉸接車(chē)軌跡跟蹤最優(yōu)控制模型的構(gòu)建過(guò)程包括:
S21、獲取預(yù)設(shè)的初始條件以及初始化參數(shù);
S22、根據(jù)所述初始條件以及初始化參數(shù),得到預(yù)測(cè)時(shí)域內(nèi)各參考點(diǎn)的橫坐標(biāo);
S23、以?
S24、根據(jù)所述
S25、更新參考點(diǎn)信息;
S26、根據(jù)更新后的參考點(diǎn)信息,獲取基于自車(chē)坐標(biāo)系的車(chē)輛狀態(tài)及環(huán)境觀測(cè)量;
S27、將所述獎(jiǎng)勵(lì)函數(shù)、基于自車(chē)坐標(biāo)系的車(chē)輛狀態(tài)及環(huán)境觀測(cè)量作為鉸接車(chē)軌跡跟蹤最優(yōu)控制模型的輸入,建立約束條件,計(jì)算目標(biāo)函數(shù),得到構(gòu)建好的鉸接車(chē)軌跡跟蹤最優(yōu)控制模型;
所述S27中的計(jì)算目標(biāo)函數(shù),包括:
采用值分布柔性執(zhí)行評(píng)價(jià)強(qiáng)化學(xué)習(xí)算法學(xué)習(xí)獨(dú)立的值分布函數(shù)以及策略函數(shù);
其中,所述值分布函數(shù),如下式(1)-(4)所示:
(1)
(2)
(3)
(4)
其中,
所述策略函數(shù),如下式(5)所示:
(5)
其中,
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述S21中的預(yù)設(shè)的初始條件以及初始化參數(shù),包括:
在?
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述S22中的根據(jù)所述初始條件以及初始化參數(shù),得到預(yù)測(cè)時(shí)域內(nèi)各參考點(diǎn)的橫坐標(biāo),包括:
在大地坐標(biāo)系下,基于當(dāng)前自車(chē)位置,利用期望速度對(duì)不同時(shí)間步的積分,求得預(yù)測(cè)時(shí)域內(nèi)各參考點(diǎn)的橫坐標(biāo)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述求得預(yù)測(cè)時(shí)域內(nèi)各參考點(diǎn)的橫坐標(biāo),如下式(6)所示:
(6)
其中,
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京科技大學(xué),未經(jīng)北京科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310572466.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





