[發明專利]基于對抗模仿學習的無人駕駛車輛換道決策方法和系統有效
| 申請號: | 202010331216.1 | 申請日: | 2020-04-24 |
| 公開(公告)號: | CN111483468B | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 綦科 | 申請(專利權)人: | 廣州大學 |
| 主分類號: | B60W50/00 | 分類號: | B60W50/00;B60W30/12;B60W30/18;B60W60/00 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 鄭浦娟 |
| 地址: | 510006 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 對抗 模仿 學習 無人駕駛 車輛 決策 方法 系統 | ||
1.一種基于對抗模仿學習的無人駕駛車輛換道決策方法,其特征在于,包括:
步驟S1、將無人駕駛車輛換道決策任務描述為部分可觀測馬爾可夫決策過程;
步驟S2、采用對抗模仿學習方法從專業駕駛示教提供的范例中進行訓練,獲得無人駕駛車輛換道決策模型;其中,在訓練過程中,對抗模仿學習方法基于方差縮減策略梯度的學習策略來模擬專業駕駛表現;
步驟S3、車輛在無人進行駕駛行駛過程中,以當前獲取的環境車輛信息為無人駕駛車輛換道決策模型的輸入參數,通過無人駕駛車輛換道決策模型獲取到車輛換道決策結果;
步驟S1中,將無人駕駛車輛換道決策任務描述為部分可觀測馬爾可夫決策過程,具體如下:
步驟S11、確定狀態Ot空間:包括車輛自車、車輛行車道前后方車輛及左右車道上距離本車最近車輛的行駛狀態[l,v0,sf,vf,sb,vb,slf,vlf,slb,vlb,srf,vrf,srb,vrb];
其中:
l為車輛自車所在車道,v0為車輛自車行駛速度;
sf、vf分別對應為自車行車道前方最近車輛到自車的距離和到自車的相對速度;
sb、vb分別對應為自車車道后方最近車輛到自車的距離和到自車的相對速度;
slf、vlf分別對應為自車的左車道前方最近車輛到自車的距離和到自車的相對速度;
slb、vlb分別對應為自車的左車道后方最近車輛到自車的距離和到自車的相對速度;
srf、vrf分別對應為自車的右車道前方最近車輛到自車的距離和到自車的相對速度;
srb、vrb分別對應為自車的右車道后方最近車輛到自車的距離和到自車的相對速度;
步驟S12、確定動作At空間:包括車輛左轉換道、車輛右轉換道、車輛車道保持且車速保持、車輛車道保持且加速以及車輛車道保持且減速。
2.根據權利要求1所述的基于對抗模仿學習的無人駕駛車輛換道決策方法,其特征在于,針對于車輛自車:
當檢測不到其行車道前方的車輛時,將sf、vf分別對應置為固定值;
當檢測不到其行車道后方的車輛時,將sb、vb分別對應置為固定值;
當檢測不到其左車道前方的車輛時,將slf、vlf分別對應置為固定值;
當檢測不到其左車道后方的車輛時,將slb、vlb分別對應置為固定值;
當檢測不到其右車道前方的車輛時,將srf、vrf分別對應置為固定值;
當檢測不到其右車道后方的車輛時,將srb、vrb分別對應置為固定值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州大學,未經廣州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010331216.1/1.html,轉載請聲明來源鉆瓜專利網。





