[發(fā)明專利]車輛自動駕駛測試方法及裝置有效
| 申請?zhí)枺?/td> | 201910957136.4 | 申請日: | 2019-10-09 |
| 公開(公告)號: | CN110686906B | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設計)人: | 陳百鳴;李明聰;趙錦濤;張志煌;李亮;肖凌云;董紅磊;王琰 | 申請(專利權)人: | 清華大學;中國標準化研究院 |
| 主分類號: | G01M17/007 | 分類號: | G01M17/007;G06N20/00 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 范彥揚 |
| 地址: | 100000*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 車輛 自動 駕駛 測試 方法 裝置 | ||
本申請實施例提供一種車輛自動駕駛測試方法及裝置,涉及車輛技術領域。該方法包括:確定當前測試環(huán)境狀態(tài);將當前測試環(huán)境狀態(tài)輸入至強化學習模型中,獲得測試車輛在當前測試環(huán)境狀態(tài)下需執(zhí)行的對被測車輛的目標干擾動作;控制測試車輛執(zhí)行目標干擾動作,以獲取被測車輛在測試車輛執(zhí)行所述目標干擾動作后產生的駕駛反應。該方案可以通過強化學習模型根據各個測試環(huán)境狀態(tài)輸出測試車輛在各個測試環(huán)境狀態(tài)下需執(zhí)行的干擾動作,從而使得測試車輛可以根據不同的測試環(huán)境狀態(tài)選擇對被測車輛最有效的干擾動作執(zhí)行,以形成對被測車輛的有效干擾,進而可以更全面地測試被測車輛在各種狀態(tài)下的駕駛反應。
技術領域
本申請涉及車輛技術領域,具體而言,涉及一種車輛自動駕駛測試方法及裝置。
背景技術
現(xiàn)有的自動駕駛測試往往是在給定的交通環(huán)境下,測試指定的車輛完成相應任務、動作的能力。在這些測試中,往往涉及到其他的交通參與者,包括其他車輛、行人等,典型的場景包括高速公路上的跟車、超車,以及城市交叉路口的通行等。
在這些測試場景中,周圍的交通參與者以給定的策略運行,這些策略可能是人為給定的,在對被測車輛進行這種環(huán)境下的測試時,被測車輛只需要適應當前設定的交通參與者的行為特點,便可以通過測試。但在現(xiàn)實中,實際的交通參與者的行為并不固定,也會有危險的駕駛行為產生,而目前采用的測試方法中交通參與者無法根據實際情況來對被測車輛產生有效干擾動作,進而無法更加全面對被測車輛的駕駛能力進行測試。
發(fā)明內容
本申請實施例的目的在于提供一種車輛自動駕駛測試方法及裝置,用以改善現(xiàn)有技術中測試車輛無法根據實際情況對被測車輛產生有效干擾動作的問題。
第一方面,本申請實施例提供了一種車輛自動駕駛測試方法,所述方法包括:確定當前測試環(huán)境狀態(tài),所述當前測試環(huán)境狀態(tài)包括測試車輛的當前位置狀態(tài)以及被測車輛的當前位置狀態(tài);將所述當前測試環(huán)境狀態(tài)輸入至強化學習模型中,獲得所述測試車輛在所述當前測試環(huán)境狀態(tài)下需執(zhí)行的對所述被測車輛的目標干擾動作,其中,在所述當前測試環(huán)境狀態(tài)下所述測試車輛執(zhí)行所述目標干擾動作所獲得的獎勵值滿足預設條件;控制所述測試車輛執(zhí)行所述目標干擾動作,以獲取所述被測車輛在所述測試車輛執(zhí)行所述目標干擾動作后產生的駕駛反應。
在上述實現(xiàn)過程中,可以通過強化學習模型根據各個測試環(huán)境狀態(tài)輸出測試車輛在各個測試環(huán)境狀態(tài)下需執(zhí)行的干擾動作,從而使得測試車輛可以根據不同的測試環(huán)境狀態(tài)選擇對被測車輛最有效的干擾動作執(zhí)行,以形成對被測車輛的有效干擾,進而可以更全面地測試被測車輛在各種狀態(tài)下的駕駛反應。
可選地,所述將所述當前測試環(huán)境狀態(tài)輸入至強化學習模型中,獲得所述測試車輛在所述當前測試環(huán)境狀態(tài)下需執(zhí)行的對所述被測車輛的目標干擾動作,包括:將所述當前測試環(huán)境狀態(tài)輸入至強化學習模型中,利用確定的獎懲函數計算獲得所述測試車輛執(zhí)行對應的目標干擾動作所獲得的獎勵值;在所述獎勵值滿足預設條件時,確定所述測試車輛在所述當前測試環(huán)境狀態(tài)下需執(zhí)行的對所述被測車輛的干擾動作為所述目標干擾動作。
在上述實現(xiàn)過程中,通過獎懲函數來計算測試車輛所獲得的獎勵值,使得測試車輛可以選擇獎勵值最大的干擾動作來執(zhí)行,從而產生對被測車輛的有效干擾。
可選地,所述獎懲函數為基于所述被測車輛的行駛質量以及所述測試車輛的安全駕駛能力確定的。根據被測車輛的行駛質量以及測試車輛的安全駕駛能力來確定獎懲函數,從而可以更多的考慮實際情況中車輛的行駛情況來確定獎懲函數,使得測試車輛可以根據獎懲函數計算獲得的獎勵值來選擇最優(yōu)的干擾動作。
可選地,所述被測車輛的行駛質量為基于所述被測車輛是否完成駕駛任務、完成駕駛任務所用時間、是否與所述測試車輛發(fā)生碰撞、與所述測試車輛發(fā)生碰撞的時間與次數以及是否違反交通規(guī)則中的至少一種情況確定的。
可選地,所述測試車輛的安全駕駛能力為基于所述測試車輛在預設時間段內與所述被測車輛之間的距離以及相對速度、所述測試車輛是否違反交通規(guī)則中的至少一種情況確定的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學;中國標準化研究院,未經清華大學;中國標準化研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910957136.4/2.html,轉載請聲明來源鉆瓜專利網。





