[發(fā)明專利]用于調(diào)整自主駕駛車輛的運(yùn)動(dòng)規(guī)劃器的基于學(xué)習(xí)的評(píng)論器在審
| 申請(qǐng)?zhí)枺?/td> | 202211406032.2 | 申請(qǐng)日: | 2022-11-10 |
| 公開(kāi)(公告)號(hào): | CN115907250A | 公開(kāi)(公告)日: | 2023-04-04 |
| 發(fā)明(設(shè)計(jì))人: | 姜舒;熊子康;林瑋曼;曹昱;羅琦;胡江滔;繆景皓 | 申請(qǐng)(專利權(quán))人: | 百度(美國(guó))有限責(zé)任公司 |
| 主分類號(hào): | G06Q10/047 | 分類號(hào): | G06Q10/047;G06N3/08;G06N3/04;G06F18/214 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 張潤(rùn) |
| 地址: | 美國(guó)加利福尼亞*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 調(diào)整 自主 駕駛 車輛 運(yùn)動(dòng) 規(guī)劃 基于 學(xué)習(xí) 評(píng)論 | ||
1.一種用于訓(xùn)練用于調(diào)整自主駕駛車輛(ADV)的運(yùn)動(dòng)規(guī)劃器的基于學(xué)習(xí)的評(píng)論器的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括:
通過(guò)自主駕駛模擬平臺(tái)接收包括人類駕駛軌跡和從人類駕駛軌跡得出的隨機(jī)軌跡的訓(xùn)練數(shù)據(jù);
通過(guò)自主駕駛模擬平臺(tái)使用訓(xùn)練數(shù)據(jù)訓(xùn)練基于學(xué)習(xí)的評(píng)論器;
通過(guò)在自主駕駛模擬平臺(tái)處運(yùn)行的基于學(xué)習(xí)的評(píng)論器,通過(guò)比較第一組軌跡和第二組軌跡來(lái)識(shí)別一組不一致的軌跡,其中第一組軌跡由具有第一組參數(shù)的運(yùn)動(dòng)規(guī)劃器生成,并且第二組軌跡由具有第二組參數(shù)的運(yùn)動(dòng)規(guī)劃器生成;以及
通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練平臺(tái),基于一組不一致的軌跡來(lái)改進(jìn)基于學(xué)習(xí)的評(píng)論器。
2.根據(jù)權(quán)利要求1所述的方法,其中,運(yùn)動(dòng)規(guī)劃器的第一組參數(shù)由基于學(xué)習(xí)的評(píng)論器針對(duì)一個(gè)或多個(gè)駕駛環(huán)境識(shí)別,并且第二組參數(shù)是運(yùn)動(dòng)規(guī)劃器的一組現(xiàn)有參數(shù)。
3.根據(jù)權(quán)利要求1所述的方法,其中,隨機(jī)軌跡中的每一個(gè)是從人類駕駛軌跡中的一個(gè)得出的,并且其中從相應(yīng)的人類駕駛軌跡得出隨機(jī)軌跡包括:
確定相應(yīng)的人類駕駛軌跡的起點(diǎn)和終點(diǎn);
改變相應(yīng)的人類駕駛軌跡的一個(gè)或多個(gè)參數(shù)中的一個(gè);以及
用改變后的參數(shù)替換人類駕駛軌跡的相應(yīng)參數(shù)以得到隨機(jī)軌跡。
4.根據(jù)權(quán)利要求3所述的方法,其中,通過(guò)對(duì)參數(shù)賦予從預(yù)定范圍中選擇的不同值來(lái)改變參數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其中,基于學(xué)習(xí)的評(píng)論器包括編碼器和相似性網(wǎng)絡(luò),其中編碼器和相似性網(wǎng)絡(luò)中的每一個(gè)是神經(jīng)網(wǎng)絡(luò)模型。
6.根據(jù)權(quán)利要求5所述的方法,其中,編碼器和相似性網(wǎng)絡(luò)中的每一個(gè)是遞歸神經(jīng)網(wǎng)絡(luò)(RNN)或多層感知器(MLP)網(wǎng)絡(luò)中的一個(gè)。
7.根據(jù)權(quán)利要求6所述的方法,其中,編碼器是RNN網(wǎng)絡(luò),其中每個(gè)RNN單元是門控循環(huán)單元(GRU)。
8.根據(jù)權(quán)利要求5所述的方法,其中,從訓(xùn)練數(shù)據(jù)提取的特征包括速度特征、路徑特征和障礙物特征,其中每個(gè)特征與目標(biāo)特征相關(guān)聯(lián),其中目標(biāo)特征是地圖場(chǎng)景相關(guān)特征。
9.根據(jù)權(quán)利要求8所述的方法,其中,經(jīng)訓(xùn)練的編碼器使用人類駕駛軌跡進(jìn)行訓(xùn)練,對(duì)速度特征、路徑特征、障礙物特征和相關(guān)聯(lián)的目標(biāo)特征進(jìn)行編碼,并生成具有與人類駕駛軌跡不同的軌跡的嵌入。
10.根據(jù)權(quán)利要求8所述的方法,其中,相似性網(wǎng)絡(luò)使用人類駕駛軌跡和隨機(jī)軌跡進(jìn)行訓(xùn)練,并且將生成反映由運(yùn)動(dòng)規(guī)劃器生成的軌跡與來(lái)自嵌入的相應(yīng)軌跡之間的差異的分?jǐn)?shù)。
11.根據(jù)權(quán)利要求1所述的方法,其中,基于學(xué)習(xí)的評(píng)論器是使用具有用于測(cè)量軌跡之間相似性的元素的損失函數(shù)來(lái)訓(xùn)練的。
12.一種其中存儲(chǔ)有指令的非暫時(shí)性機(jī)器可讀介質(zhì),當(dāng)所述指令由處理器執(zhí)行時(shí),使所述處理器執(zhí)行如權(quán)利要求1至11中任一項(xiàng)所述的方法的操作。
13.一種調(diào)整自主駕駛車輛(ADV)的運(yùn)動(dòng)規(guī)劃器的方法,包括:
從基于學(xué)習(xí)的評(píng)論器建立目標(biāo)函數(shù);
應(yīng)用優(yōu)化操作來(lái)優(yōu)化目標(biāo)函數(shù),以確定用于一個(gè)或多個(gè)駕駛環(huán)境的自主駕駛車輛(ADV)的動(dòng)態(tài)模型的運(yùn)動(dòng)規(guī)劃器的一組最優(yōu)參數(shù);
使用具有用于一個(gè)或多個(gè)駕駛環(huán)境的一組最優(yōu)參數(shù)的運(yùn)動(dòng)規(guī)劃器生成第一組軌跡;
使用具有用于一個(gè)或多個(gè)駕駛環(huán)境的一組現(xiàn)有參數(shù)的基于學(xué)習(xí)的評(píng)論器生成第二組軌跡;
生成指示第一組軌跡和第二組軌跡之間的差異的分?jǐn)?shù)。
14.根據(jù)權(quán)利要求13所述的方法,進(jìn)一步包括:
通過(guò)比較第一組軌跡和第二組軌跡識(shí)別一組不一致的軌跡;
基于一組不一致的軌跡改進(jìn)基于學(xué)習(xí)的評(píng)論器。
15.根據(jù)權(quán)利要求14所述的方法,進(jìn)一步包括:
在閉環(huán)中執(zhí)行識(shí)別和改進(jìn),直到分?jǐn)?shù)達(dá)到預(yù)定閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度(美國(guó))有限責(zé)任公司,未經(jīng)百度(美國(guó))有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211406032.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 色相調(diào)整系統(tǒng)及其調(diào)整方法
- 調(diào)整設(shè)備和調(diào)整方法
- 踏板調(diào)整結(jié)構(gòu)及調(diào)整步態(tài)的調(diào)整方法
- 立體深度調(diào)整和焦點(diǎn)調(diào)整
- 調(diào)整裝置及其調(diào)整方法
- 噴嘴調(diào)整工具及調(diào)整方法
- 調(diào)整系統(tǒng)及調(diào)整方法
- 調(diào)整裝置以及調(diào)整方法
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 功率調(diào)整器(調(diào)整)





