[發明專利]用于調整自主駕駛車輛的運動規劃器的基于學習的評論器在審
| 申請號: | 202211406032.2 | 申請日: | 2022-11-10 |
| 公開(公告)號: | CN115907250A | 公開(公告)日: | 2023-04-04 |
| 發明(設計)人: | 姜舒;熊子康;林瑋曼;曹昱;羅琦;胡江滔;繆景皓 | 申請(專利權)人: | 百度(美國)有限責任公司 |
| 主分類號: | G06Q10/047 | 分類號: | G06Q10/047;G06N3/08;G06N3/04;G06F18/214 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 美國加利福尼亞*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 調整 自主 駕駛 車輛 運動 規劃 基于 學習 評論 | ||
本文描述了一種訓練用于調整自主駕駛車輛的基于規則的運動規劃器的基于學習的評論器的方法,一種使用具有基于學習的評論器的自主調整框架調整運動規劃器的方法。方法包括接收包括人類駕駛軌跡和從人類駕駛軌跡得出的隨機軌跡的訓練數據;使用訓練數據訓練基于學習的評論器;通過比較第一組軌跡和第二組軌跡識別一組不一致的軌跡;以及在神經網絡訓練平臺處,基于一組不一致的軌跡改進基于學習的評論器。
技術領域
本公開的實施例一般涉及操作自主車輛。更特別地,本公開的實施例涉及自主駕駛車輛的運動規劃器的參數調整。
背景技術
當以自主模式駕駛時,自主駕駛車輛(ADV)可以減輕乘坐者,尤其是駕駛員的一些駕駛相關責任。當以自主模式操作時,車輛可以使用車載傳感器導航到各種位置,從而允許車輛以最小的人機交互或者在沒有任何乘客的一些情況下行駛。
運動規劃,也稱為路徑規劃,是大規模、注重安全、真實世界自主駕駛車輛的關鍵。運動規劃器可以是基于規則的或基于學習的。每種類型的運動規劃器有其優點和缺點。例如,基于規則的運動規劃器將運動規劃制定為受約束的優化問題。盡管基于規則的運動規劃器是可靠且可解釋的,但其性能在很大程度上取決于優化問題與參數的關系如何。這些參數是為各種目的而設計的,諸如建模不同的場景、平衡每個單個目標的權重,因此需要手動微調以獲得最優性能。另一方面,基于學習的規劃器從大量的人類示范中學習,以創建類似人類的駕駛規劃,從而避免繁瑣的規則和約束設計過程。然而,缺乏可解釋性阻礙了其在自主駕駛等注重安全的任務中的應用。
發明內容
第一方面,提供一種用于訓練用于調整自主駕駛車輛(ADV)的運動規劃器的基于學習的評論器的計算機實現的方法,所述方法包括:
通過自主駕駛模擬平臺接收包括人類駕駛軌跡和從人類駕駛軌跡得出的隨機軌跡的訓練數據;
通過自主駕駛模擬平臺使用訓練數據訓練基于學習的評論器;
通過在自主駕駛模擬平臺處運行的基于學習的評論器,通過比較第一組軌跡和第二組軌跡來識別一組不一致的軌跡,其中第一組軌跡由具有第一組參數的運動規劃器生成,并且第二組軌跡由具有第二組參數的運動規劃器生成;以及
通過神經網絡訓練平臺,基于一組不一致的軌跡來改進基于學習的評論器。
第二方面,提供一種其中存儲有指令的非暫時性機器可讀介質,當所述指令由處理器執行時,使所述處理器執行如第一方面所述的方法的操作。
第三方面,提供一種調整自主駕駛車輛(ADV)的運動規劃器的方法,包括:
從基于學習的評論器建立目標函數;
應用優化操作來優化目標函數,以確定用于一個或多個駕駛環境的自主駕駛車輛(ADV)的動態模型的運動規劃器的一組最優參數;
使用具有用于一個或多個駕駛環境的一組最優參數的運動規劃器生成第一組軌跡;
使用具有用于一個或多個駕駛環境的一組現有參數的基于學習的評論器生成第二組軌跡;
生成指示第一組軌跡和第二組軌跡之間的差異的分數。
通過本公開的實施例,自主調整框架可以消除繁瑣的參數調整中的人力,減少調整時間,同時保留基于規則的運動規劃器的物理和安全約束。此外,當基于學習的評論器使用不同的人類駕駛數據集進行訓練時,自主調整框架可以創建個性化的運動規劃器。
附圖說明
本公開的實施例通過示例的方式示出并且不限于附圖中的圖,在附圖中相同的附圖標記表示相似的元件。
圖1示出了根據一個實施例的運動規劃器調整框架100。
圖2A、2B和2C示出了根據一個實施例的如何從示范軌跡生成附加軌跡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度(美國)有限責任公司,未經百度(美國)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211406032.2/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





