[發明專利]一種基于對抗生成模仿學習的自動駕駛控制方法有效
| 申請號: | 202110954992.1 | 申請日: | 2021-08-19 |
| 公開(公告)號: | CN113635909B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 崔建勛;曲明成 | 申請(專利權)人: | 崔建勛;曲明成 |
| 主分類號: | B60W50/00 | 分類號: | B60W50/00;B60W60/00;B60W40/02;B60W40/10;B60W40/105;B60W30/12;B60W30/14;B60W30/18 |
| 代理公司: | 哈爾濱華夏松花江知識產權代理有限公司 23213 | 代理人: | 張利明 |
| 地址: | 150090 黑龍江省哈爾濱市*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 對抗 生成 模仿 學習 自動 駕駛 控制 方法 | ||
一種基于對抗生成模仿學習的自動駕駛控制方法,屬于自動駕駛策略生成技術領域。解決了現有基于學習的自動駕駛決策存在安全性和平穩性差的問題。本發明利用狀態地圖、目標自動駕駛車輛及周邊車輛實時狀態輸入至決策器,決策器采用經對抗生成的訓練方式訓練的深度神經網絡,獲取目標自動駕駛車輛的決策行為信號;再采用Bezier曲線作駕駛路徑規劃,獲得規劃路徑;在規劃路徑上進行等時間間隔抽樣,獲取采樣點,并采用曲線擬合算法,獲取每兩個采樣點間路徑的速度和加速度,采用PID控制方法,獲得目標自動駕駛車輛的動作控制信號。本發明適用于自動駕駛控制。
技術領域
本發明屬于自動駕駛策略生成技術領域。
背景技術
決策是自動駕駛整體技術譜系中的關鍵一環。一般情況下,自動駕駛的技術模塊組成按照順序包括:感知→全局路徑規劃→決策→局部運動規劃→車輛控制5個環節,其中決策直接決定了后續運動規劃和車輛控制的安全性和效率,是自動駕駛承上啟下的關鍵技術環節。
當前自動駕駛決策模塊多是采用基于規則的方法來構建,也就是盡可能枚舉每一種自動車輛可能遇到的駕駛情景,然后,預先設置好每一種駕駛情境下自動車輛需要執行的決策行為。這種做法存在諸多的弊端:(1)自動駕駛,尤其是開放道路下的自動駕駛,常常面對的交通場景具有高度的動態性、復雜性和不確定性,這使得定義一個相對“完備”的“狀態-決策”規則集十分困難,甚至是不可能的;(2)基于規則的決策方法過于“僵硬”,遇到事先沒有定義好的情況,自動駕駛車將不知道如何做出決策,有可能造成安全事故或者“停機”狀態。
因此,為了克服基于規則的自動駕駛決策帶來的問題,另外一種常見的做法是基于學習的方式來構建決策模塊,例如較為前沿、常用的是強化學習(尤其是深度強化學習)。基于學習的自動駕駛決策,通過自動駕駛車輛與環境的大量互動,不斷的收集“駕駛經驗”,從而提高自身的決策制定水平,無需人為事先制定規則集,此外,基于學習的方法,對于訓練過程中沒有碰到的駕駛情景,天然的具有很好的泛化能力。因此,基于強化學習的自動駕駛決策被認為是一種極具潛力的研究方法。但同時,其也存在一個極其嚴重的潛在問題,那就是基于學習的自動駕駛決策,無法整合考慮自動駕駛情況下的安全性和平穩性。
發明內容
本發明目的是為了解決現有基于學習的自動駕駛決策存在安全性和平穩性差的問題,提出了一種基于對抗生成模仿學習的自動駕駛控制方法。
本發明所述一種基于對抗生成模仿學習的自動駕駛控制方法,該方法包括:
步驟S1、采集目標自動駕駛車輛同向所有車道內的動態、靜態目標的位置、速度以及自身的位置、航向角和速度信息;
步驟S2、利用地圖、車道線、交通標志標線和步驟S1獲取的信息,獲取目標自動駕駛車輛所在環境的狀態地圖;
步驟S3、將步驟S2所述狀態地圖、目標自動駕駛車輛及周邊車輛實時狀態輸入至決策器,決策器采用經對抗生成的訓練方式訓練的深度神經網絡,獲取目標自動駕駛車輛的決策行為信號;
步驟S4、利用步驟S2所述狀態地圖和目標自動駕駛車輛的決策行為信號,采用Bezier曲線作駕駛路徑規劃,獲得規劃路徑;
步驟S5、在規劃路徑上進行等時間間隔抽樣,獲取采樣點,并采用曲線擬合算法,獲取每兩個采樣點間路徑的速度和加速度;
步驟S6、利用每兩個采樣點間路徑的速度和加速度,采用PID控制方法,獲得目標自動駕駛車輛的動作控制信號。
進一步地,本發明中,步驟S3中,決策器還包括判別器,所述判別器用于在決策器的深度神經網絡進行訓練;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于崔建勛;曲明成,未經崔建勛;曲明成許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110954992.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于期權定價模型的商業承兌匯票信用評分方法及系統
- 下一篇:一種真空篩分設備





