[發明專利]自動泊車方法、裝置、計算機設備和存儲介質有效
| 申請號: | 201911317486.0 | 申請日: | 2019-12-19 |
| 公開(公告)號: | CN111126598B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 莫松文;任仲超;凌云志;張業楚 | 申請(專利權)人: | 深圳南方德爾汽車電子有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/0464;G06Q10/04;B60W30/06 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 羅瑞鋒 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 泊車 方法 裝置 計算機 設備 存儲 介質 | ||
本發明公開了本發明提供了一種自動泊車方法、裝置、計算機設備和存儲介質,方法包括以下步驟:獲取用戶所需泊車車位坐標和車輛當前所在空間坐標,以得到用戶需求信息數據;將用戶需求信息數據帶入預先根據duel_dqn強化學習算法訓練的模型得到最佳泊車線路模型;根據最佳泊車線路模型,輸出對應的車輛方向盤角度和油門值。與現有技術相比,本發明的實施例提供了一種自動泊車方法、裝置、計算機設備和存儲介質,其采用強化學習duel_dqn算法實現自動泊車,從而無需中間路徑規劃,減少了工作量,解決了問題診斷的難題。
技術領域
本發明涉及自動泊車算法技術領域,尤其涉及一種基于強化學習算法的自動泊車方法、裝置、計算機設備和存儲介質。
背景技術
目前市面的泊車系統都是基于傳感器獲取的障礙物數據和車位數據,然后送往下游規劃控制模塊,具體流程如下描述:
通過camera或者lidar(激光雷達)獲取障礙物的位置(obstacle_position)和車位(parking_position)的位置,映射到一張全局地圖,然后標記處自己車身的位置(ego_position);通過航跡推算的方式獲取車的實時位態(localization);基于ego_position和parking_position進行路徑規劃(planning)輸出path;獲取path設計控制器(controller)進行follow;輸出方向盤的轉向角和油門值。
發明內容
本發明的實施例提供了一種自動泊車方法、裝置、計算機設備和存儲介質,旨在解決現有自動泊車方法效率低、耗時間、故障診斷困難的問題。
為達到上述目的,本發明所提出的技術方案為:
第一方面,本發明提供了一種自動泊車方法,其包括以下步驟:
獲取用戶所需泊車車位坐標和車輛當前所在空間坐標,以得到用戶需求信息數據;
將用戶需求信息數據帶入預先根據duel_dqn強化學習算法訓練的模型得到最佳泊車線路模型;
根據最佳泊車線路模型,輸出對應的車輛方向盤角度和油門值。
其中,所述步驟“將用戶需求信息數據帶入預先根據duel_dqn強化學習算法訓練的模型得到最佳泊車線路模型”包括:
設定泊車終點位置信息、車輛當前所在位置信息,以及泊車所需經過的全部障礙位置信息;
將不同的方向盤角度和油門值輸入至值函數網絡,以得到loss函數;
根據loss函數,調整值函數網絡的參數,以得到最佳值函數網絡;
根據最佳值函數網絡,搭建兩層神經連接層擬合得到最佳泊車線路模型。
其中,所述步驟“將不同的方向盤角度和油門值輸入至值函數網絡,以得到loss函數”中獲取loss函數采用TD_error算法。
其中,所述步驟“將用戶需求信息數據帶入預先根據duel_dqn強化學習算法訓練的模型得到最佳泊車線路模型”中,duel_dqn強化學習算法的reward值設定為:若車輛發生碰撞則reward值為-2,若車輛到達指定目的地則reward值為1,其他reward值為0。
第二方面,本發明提供了一種自動泊車裝置,其包括:
信息獲取單元,用于獲取用戶所需泊車車位坐標和車輛當前所在空間坐標,以得到用戶需求信息數據;
模型訓練單元,將用戶需求信息數據帶入預先根據duel_dqn強化學習算法訓練的模型得到最佳泊車線路模型;
信息輸出單元,根據最佳泊車線路模型,輸出對應的車輛方向盤角度和油門值。
其中,所述模型訓練單元包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳南方德爾汽車電子有限公司,未經深圳南方德爾汽車電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911317486.0/2.html,轉載請聲明來源鉆瓜專利網。





