[發明專利]一種端到端自動駕駛方法與系統、存儲介質在審

申請號：	202111515832.3	申請日：	2021-12-13
公開（公告）號：	CN116264005A	公開（公告）日：	2023-06-16
發明（設計）人：	王丹;王玉龍	申請（專利權）人：	廣州汽車集團股份有限公司
主分類號：	G06V20/56	分類號：	G06V20/56;G06V10/26;G06V10/764;B60W60/00
代理公司：	深圳匯智容達專利商標事務所(普通合伙) 44238	代理人：	徐文城
地址：	510030 廣東省廣州市越秀***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種端到端自動駕駛方法系統存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種端到端自動駕駛方法，其特征在于，包括如下步驟：

步驟S100、在車輛駕駛過程中，接收當前時刻的車輛前方圖像，并對所述當前時刻的車輛前方圖像進行語義識別獲得當前時刻的第一語義分割圖；

步驟S200、將所述當前時刻的車輛前方圖像和所述當前時刻的第一語義分割圖作為當前時刻的模型輸入量一并輸入預先訓練好的端到端自動駕駛模型進行處理，得到第二語義分割圖和所述車輛動作控制信息；其中，所述車輛動作控制信息包括方向盤轉角、車輛速度；

其中，所述端到端自動駕駛模型包括概率圖模型和駕駛策略模型；所述概率圖模型用于根據當前時刻的模型輸入量進行推理得到潛在狀態變量，并根據所述潛在狀態變量進行解碼得到第二語義分割圖；所述駕駛策略模型用于根據所述概率圖模型輸出的潛在狀態變量進行駕駛決策得到車輛動作控制信息。

2.根據權利要求1所述的方法，其特征在于，所述概率圖模型具體用于根據所述當前時刻的模型輸入量以及歷史時刻的模型輸入量和車輛動作進行推理得到潛在狀態變量。

3.根據權利要求2所述的方法，其特征在于，所述概率圖模型包括濾波模塊、潛在動態模塊和生成模塊，所述濾波模塊用于對輸入所述概率圖模型的模型輸入量進行濾波處理，所述潛在動態模塊用于根據所述濾波模塊的濾波處理結果推理得到潛在狀態變量，所述生成模塊用于根據所述潛在狀態變量進行解碼得到第二語義分割圖。

4.根據權利要求3所述的方法，其特征在于，所述駕駛策略模型基于最大熵強化學習算法中的隨機策略學習算法訓練得到。

5.根據權利要求4所述的方法，其特征在于，所述端到端自動駕駛模型的優化目標函數為f＝f₁+f₂，所述概率圖模型的優化目標函數為f₁，所述駕駛策略模型的優化目標函數為f₂；

其中：

表示所述生成模塊根據所述潛在狀態變量進行解碼得到車輛前方圖像，為所述第二語義分割圖，為所述潛在動態模塊推理得到的潛在狀態變量，為所述濾波模塊的濾波處理結果，x_1：t+1為車輛駕駛的初始時刻到t+1時刻的車輛前方圖像，a_1：t為車輛駕駛的初始時刻到t時刻的車輛動作，m_1：t+1為車輛駕駛的初始時刻到t+1時刻的語義分割圖，z_1：t+H為車輛駕駛的初始時刻到t+H時刻的潛在狀態變量，z_1：t+1為車輛駕駛的初始時刻到t+1時刻的潛在狀態變量，a_t+1：t+H為車輛駕駛的t+1時刻到t+H時刻的車輛動作，t+1時刻為當前時刻，H大于0，a_t+H為t+H時刻的車輛動作，z_t+H為t+H時刻的潛在狀態變量，π(a_t+H|z_t+H)為t+H時刻的駕駛策略，π(a_t|z_t)為t時刻的駕駛策略，P(z_t+1|z_t，a_t)為根據t時刻的潛在狀態變量和車輛動作預測得到的t+1時刻的潛在狀態變量，z_t+1為t+1時刻的潛在狀態變量，z_t為t時刻的潛在狀態變量，a_t為t時刻的車輛動作。