[發明專利]一種車輛動作預測模型的訓練方法及車輛控制方法在審
| 申請號: | 202211244158.4 | 申請日: | 2022-10-11 |
| 公開(公告)號: | CN115630300A | 公開(公告)日: | 2023-01-20 |
| 發明(設計)人: | 李奇達;王東科 | 申請(專利權)人: | 中汽創智科技有限公司 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06N3/045;G06N3/08;B60W60/00;B60W50/00 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 方秀琴 |
| 地址: | 211100 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 車輛 動作 預測 模型 訓練 方法 控制 | ||
本公開涉及車輛動作預測模型的訓練方法及車輛控制方法,車輛動作預測模型包括當前動作預測網絡和后續動作預測網絡,該訓練方法包括:獲取訓練數據,該訓練數據包括第一時刻下的動作數據和第一狀態數據,以及第二時刻下的第二狀態數據;將第一時刻下的動作數據和第一狀態數據輸入當前動作預測網絡,將第二狀態數據輸入后續動作預測網絡;基于第一網絡和第二網絡分別對于當前動作預測網絡和后續動作預測網絡的預測結果進行執行表現預測;根據執行表現預測結果調整上述各網絡的參數;上述訓練數據基于駕駛員駕駛車輛、自動駕駛仿真平臺、自動駕駛軌跡規劃分別產生的車輛運動數據和高精地圖確定。本公開可以提高訓練數據的質量,避免陷入局部最優。
技術領域
本公開涉及自動駕駛技術領域,尤其涉及一種車輛動作預測模型的訓練方法及車輛控制方法。
背景技術
近些年來,自動駕駛技術成為各大互聯網服務供應商的研究熱點,其中已提出的與軌跡規劃車輛控制相關的方法可以大致分為兩類:非數據驅動的方法和基于機器學習的數據驅動方法。目前已有的基于機器學習的軌跡規劃車輛控制相關的方法絕大多數以在線算法作為基礎,智能體與仿真環境互動,通過試錯和判斷的方式最大化獎勵函數從而找尋到最優的軌跡策略,該方法在開發過程中除了算法體系構建外還需要在仿真環境搭建上分配額外的工作任務,增加了技術人員的工作強度;其次,該方法中的智能體只能基于自身的經驗進行學習,而無法學習其他最優或次優策略的經驗,容易陷入局部最優。除此以外,相關方法多數應用于高速場景,考慮交通信號燈、交通標志等信息可能會導致軌跡規劃和車輛控制任務的失敗。
發明內容
為了解決上述提出的至少一個技術問題,本公開提出了一種車輛動作預測模型的訓練方法及車輛控制方法。
根據本公開的一方面,提供了一種車輛動作預測模型的訓練方法,所述車輛動作預測模型包括當前動作預測網絡和后續動作預測網絡,其特征在于,所述方法包括:獲取訓練數據,所述訓練數據包括第一時刻下的動作數據和第一狀態數據,以及第二時刻下的第二狀態數據,所述第二時刻為所述第一時刻的下一個時刻;將所述第一時刻下的動作數據和第一狀態數據輸入所述當前動作預測網絡,以及將所述第二狀態數據輸入所述后續動作預測網絡;基于第一網絡和第二網絡分別對于所述當前動作預測網絡和所述后續動作預測網絡的預測結果進行執行表現預測;根據執行表現預測結果調整所述當前動作預測網絡、所述后續動作預測網絡、所述第一網絡和所述第二網絡的參數;其中,所述訓練數據基于駕駛員駕駛車輛產生的車輛運動數據、自動駕駛仿真平臺產生的車輛運動數據以及自動駕駛軌跡規劃產生的車輛運動數據和高精地圖確定。
在一些可能的實施方式中,所述第一網絡包括至少一個第一子網絡,所述第二網絡包括至少一個第二子網絡,各所述第一子網絡均與所述當前動作預測網絡連接,各所述第二子網絡均與所述后續動作預測網絡連接。
在一些可能的實施方式中,所述將所述第一時刻下的動作數據和第一狀態數據輸入所述當前動作預測網絡,以及將所述第二狀態數據輸入所述后續動作預測網絡,包括:將所述第一時刻下的動作數據和第一狀態數據輸入所述當前動作預測網絡,得到所述第一時刻下的第一預估動作;將所述第二狀態數據輸入所述后續動作預測網絡,得到所述第二時刻下的第二預估動作。
在一些可能的實施方式中,所述第一網絡包括至少一個第一子網絡,所述第二網絡包括至少一個第二子網絡,所述基于第一網絡和第二網絡分別對于所述當前動作預測網絡和所述后續動作預測網絡的預測結果進行執行表現預測,包括:將所述第一預估動作和所述第一狀態數據輸入每一所述第一子網絡,得到對應的第一預測結果,所述第一預測結果表征車輛在所述第一狀態數據對應的情況下執行所述第一預估動作所對應的執行結果;將所述第二預估動作和所述第二狀態數據輸入每一所述第二子網絡,得到對應的第二預測結果,所述第二預測結果表征車輛在所述第二狀態數據對應的情況下執行所述第二預估動作所對應的執行結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中汽創智科技有限公司,未經中汽創智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211244158.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:關鍵節點的確定方法、裝置、電子設備及存儲介質
- 下一篇:按壓泵及容器





