[發明專利]一種基于學習采樣式的汽車自動駕駛運動規劃方法及系統有效
| 申請號: | 202010236474.1 | 申請日: | 2020-03-30 |
| 公開(公告)號: | CN111413974B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 江昆;周偉韜;楊殿閣;嚴瑞東;黃晉 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 孫楠 |
| 地址: | 100084 北京市海淀區1*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 學習 樣式 汽車 自動 駕駛 運動 規劃 方法 系統 | ||
本發明涉及一種基于學習采樣式的汽車自動駕駛運動規劃方法及系統,其包括:建立車輛運動學模型;初始化Open表和Closed表;計算每條前向仿真軌跡的評價值,選取評價值最高的軌跡作為規則最優軌跡;對前向仿真軌跡進行Q值函數估計,選擇Q值最大的軌跡作為強化學習軌跡;從規則最優軌跡和強化學習軌跡中選取初段最優軌跡,并存入Closed表中;利用碰撞檢測方法篩選不碰撞前向仿真軌跡,將不碰撞的前向仿真軌跡存入Open表中;計算每條前向仿真軌跡的評價值,選取評價值最高的前向仿真軌跡作為候選最優軌跡,并存入Closed表中;候選最優軌跡終點在運動規劃所需求的終點范圍內時結束運動規劃過程;將Closed表格中的初段最優軌跡和候選最優軌跡連接,形成最終規劃軌跡。
技術領域
本發明涉及一種智能車輛領域,特別是關于一種基于學習采樣式的汽車自動駕駛運動規劃方法及系統。
背景技術
近年來,人工智能技術在智能交通和車輛領域逐漸開始商業化應用,智能網聯車輛逐漸走入人們的視野。一般來說,智能車輛的自動駕駛軟件系統可以分為感知、定位、決策和控制四個模塊。運動規劃作為決策模塊中最為重要的部分,決定了智能車輛的決策質量。由于控制模塊一般只完成運動/軌跡跟蹤的工作,所以運動規劃的結果對車輛最終駕駛行為的影響至關重要。
現有的運動規劃方法可以大致分為基于采樣的方法、基于優化的方法和基于端到端學習的方法。基于端到端學習的方法建立直接從傳感器數據到駕駛動作的映射,但由于學習方法的黑箱特性,難以進行工程實踐及優化;基于優化的方法一般依賴車道線或其他先驗的道路信息,求解時間往往難以得到保證;基于采樣的方法由于其求解速度快,能夠適應多種環境特性的特點,在自動駕駛的運動規劃中得到廣泛采用。
基于采樣的方法一般通過代價函數進行采樣軌跡或運動狀態的選取,這種方式本質上是基于人為設定的規則的最優軌跡/運動狀態選取,但人為設定的代價函數很難適應復雜多變的現實環境。
發明內容
針對上述問題,本發明的目的是提供一種基于學習采樣式的汽車自動駕駛運動規劃方法及系統,其能更好的考慮環境中的不確定性和隨機性,可以提升自動駕駛運動規劃的安全性和魯棒性。
為實現上述目的,本發明采取以下技術方案:一種基于學習采樣式的汽車自動駕駛運動規劃方法,其包括以下步驟:S1:根據車輛參數建立車輛運動學模型;S2:初始化啟發式運動規劃方法的存儲表格:Open表和Closed表;S3:基于學習采樣式方法,從起點生成一系列前向仿真軌跡,并通過啟發式函數,計算每條前向仿真軌跡的評價值,選取評價值最高的軌跡作為規則最優軌跡;利用強化學習方法對前向仿真軌跡進行Q值函數估計,選擇Q值最大的軌跡作為強化學習軌跡;從規則最優軌跡和強化學習軌跡中選取初段最優軌跡,將初段最優軌跡存入Closed表中,并由初段最優軌跡終點作為隨后規劃的起點;S4:基于啟發式規劃方法,從規劃起點開始,生成一系列前向仿真軌跡;利用碰撞檢測方法篩選不碰撞前向仿真軌跡,并將這些不碰撞的前向仿真軌跡存入Open表中;通過啟發式函數,計算每條前向仿真軌跡的評價值,選取評價值最高的前向仿真軌跡作為候選最優軌跡,并將候選最優軌跡及其評價值存入Closed表中,并由候選最優軌跡終點作為隨后規劃起點;S5:重復步驟S4,直至步驟S4中的候選最優軌跡終點在運動規劃所需求的終點范圍內時,結束運動規劃過程;S6:將Closed表格中的初段最優軌跡和候選最優軌跡連接,形成最終規劃軌跡。
進一步,所述步驟S3中,前向仿真軌跡是利用車輛方向盤轉角加速度、油門/剎車輸入生成。
進一步,所述前向仿真軌跡生成方法為:根據使用場景確定仿真步長Δt,通過車輛運動學模型求解得到實現車輛位置x、y和車輛方向θ的更新,不斷迭代,實現車輛軌跡的更新,最終得到前向仿真軌跡。
進一步,所述步驟S3中,在將前向仿真軌跡存入Open表格之前,首先對前向仿真軌跡進行碰撞檢測,檢測生成的前向仿真軌跡與感知結果中障礙物的邊界是否產生碰撞,如果軌跡發生碰撞,則直接刪除,不碰撞的軌跡存入Open表中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010236474.1/2.html,轉載請聲明來源鉆瓜專利網。





