[發明專利]創建用于模擬自主駕駛車輛的模擬環境的方法和系統在審
| 申請號: | 202211596038.0 | 申請日: | 2022-12-13 |
| 公開(公告)號: | CN115859821A | 公開(公告)日: | 2023-03-28 |
| 發明(設計)人: | 姜舒;曹昱;林瑋曼;羅琦;熊子康;繆景皓;胡江滔 | 申請(專利權)人: | 百度(美國)有限責任公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06F18/214;G06T17/00;G06N3/0455;G06N3/092;G01M17/007 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 石茵汀 |
| 地址: | 美國加利福尼亞*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 創建 用于 模擬 自主 駕駛 車輛 環境 方法 系統 | ||
1.一種創建用于模擬自主駕駛車輛(ADV)的模擬環境的計算機實現的方法,包括:
通過模擬平臺基于記錄文件或地圖信息中的一個或多個創建虛擬駕駛環境,其中虛擬駕駛環境包括多個模擬障礙物車輛;
在所述模擬平臺處接收多個運動規劃器,其中每個運動規劃器使用多個基于學習的評論器中的一個進行調整,其中使用具有不同的類似于人的駕駛風格的多個數據集中的一個訓練所述多個基于學習的評論器中的每個;
通過所述模擬平臺將每個運動規劃器安裝到所述模擬障礙物車輛之一中。
2.根據權利要求1所述的方法,其中,所述多個訓練數據集中的每個是根據從多個人類駕駛的車輛收集的人類駕駛數據創建的。
3.根據權利要求2所述的方法,其中,所述多個訓練數據集中的每個包括來自所述多個人類駕駛的車輛中的每個的特定駕駛風格的數據。
4.根據權利要求1所述的方法,其中每個基于學習的評論器和每個運動規劃器具有與對應的訓練數據集相同的風格。
5.根據權利要求1所述的方法,其中調整所述運動規劃器包括:
接收訓練數據集,其中所述訓練數據集包括人類駕駛軌跡;
從所述人類駕駛軌跡得出隨機軌跡;
使用所述人類駕駛軌跡和得出的隨機軌跡訓練基于學習的評論器;
通過所述基于學習的評論器通過比較第一組軌跡和第二組軌跡來識別一組不一致的軌跡,其中所述第一組軌跡由具有第一組參數的運動規劃器生成,以及所述第二組軌跡由具有第二組參數的運動規劃器生成;
基于所述一組不一致的軌跡改進所述基于學習的評論器。
6.根據權利要求5所述的方法,其中所述運動規劃器的所述第一組參數由所述基于學習的評論器針對一個或多個駕駛環境識別,并且所述第二組參數是所述運動規劃器的一組現有參數。
7.根據權利要求5所述的方法,其中從對應的人類駕駛軌跡得出隨機軌跡包括:
確定相應的人類駕駛軌跡的起點和終點;
改變相應的人類駕駛軌跡的一個或多個參數中的一個;
用改變后的參數替換所述人類駕駛軌跡的相應參數以得到所述隨機軌跡。
8.根據權利要求7所述的方法,其中,通過給所述參數賦予從預定范圍中選擇的不同值來改變所述參數。
9.根據權利要求1所述的方法,其中,所述基于學習的評論器包括編碼器和相似性網絡,其中所述編碼器和所述相似性網絡中的每一個是神經網絡模型。
10.根據權利要求9所述的方法,其中,所述編碼器和所述相似性網絡中的每一個是循環神經網絡(RNN)或多層感知器(MLP)網絡中的一個。
11.根據權利要求10所述的方法,其中,所述編碼器是RNN網絡,每個RNN單元是門控循環單元(GRU)。
12.根據權利要求9所述的方法,其中,從所述訓練數據提取的特征包括速度特征、路徑特征和障礙物特征,其中每個特征與目標特征相關聯,其中所述目標特征是地圖場景相關特征。
13.根據權利要求12所述的方法,其中,所述經訓練的編碼器使用所述人類駕駛軌跡被訓練,對速度特征、路徑特征、障礙物特征和相關聯的目標特征進行編碼,并生成具有不同于所述人類駕駛軌跡的軌跡的嵌入。
14.根據權利要求12所述的方法,其中,所述相似性網絡使用所述人類駕駛軌跡和所述隨機軌跡進行訓練,并且生成反映由所述運動規劃器生成的軌跡與來自所述嵌入的相應軌跡之間的差異的分數。
15.根據權利要求1所述的方法,其中,所述基于學習的評論器是使用具有用于測量軌跡之間的相似性的元素的損失函數來訓練的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度(美國)有限責任公司,未經百度(美國)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211596038.0/1.html,轉載請聲明來源鉆瓜專利網。





