[發明專利]一種基于A3C-SRU的智能車匯入車流方法及系統在審
| 申請號: | 202010193244.1 | 申請日: | 2020-03-18 |
| 公開(公告)號: | CN111625989A | 公開(公告)日: | 2020-09-04 |
| 發明(設計)人: | 杜煜;吳思凡;徐世杰;鹿鑫 | 申請(專利權)人: | 北京聯合大學 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06N3/08;G08G1/01;G08G1/08 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100101 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 a3c sru 智能 匯入 車流 方法 系統 | ||
1.一種基于A3C-SRU的智能車匯入車流方法,其特征在于:該方法包括如下步驟,
步驟一:由數碼攝像頭、多線激光雷達、毫米波雷達、gps定位系統裝置提取環境參數和車輛參數;
步驟二:根據步驟一中提取的環境參數和車輛參數利用仿真軟件搭建仿真環境平臺;
步驟三:在步驟二中的仿真環境平臺中設置匯入車流的約束條件及強化學習方法的參數;
步驟四:根據步驟二搭建的仿真環境利用深度強化學習A3C-SRU算法進行多回合訓練,以獲得匯入車輛的決策過程;
步驟五:根據步驟四中訓練后的決策過程獲得步驟二中的最優動作序列,保存訓練后的模型,并將訓練后的模型輸入到智能車,實現匯入車流任務。
2.根據權利要求1所述的一種基于A3C-SRU的智能車匯入車流方法,其特征在于,所述步驟一中的環境參數和車輛參數包括:環境中的車道的寬度d;環境中主路車道數n;環境中主路的長度L1以及匯入匝道的長度L2;環境中主路車輛的限速v主以及環境中匝道車輛限速v匝;主路的車流量N、加速度ac、速度vc、初速度vinit;車輛的長度cv和寬度wc。
3.根據權利要求1所述的一種基于A3C-SRU的智能車匯入車流方法,其特征在于,所述步驟二中具體的環境匯入場景構建如下:
步驟21,利用仿真軟件根據實際場景的車道的寬度d、環境中主路車道數n、環境中主路的長度L1以及匯入匝道的長度L2、環境中主路車輛的限速v主以及環境中匝道車輛限速v匝搭建實際場景的匯入車流環境;
步驟22,輸入所采集實際場景的主路的車輛量、車輛加速度、車輛速度、初速度、車輛長度和寬度數據;
步驟23,根據步驟21、步驟22代建實際場景仿真平臺,根據實際匯入車輛的設置匯入車輛信息。
4.根據權利要求1或2或3所述的一種基于A3C-SRU的智能車匯入車流方法,其特征在于,匯入車流的約束條件及強化學習算法的參數具體包括四元組空間(st,at,rt,st+1),其中st為當前狀態,at為當前狀態所執行的動作值,rt為當前狀態獲得的獎懲函數值,st+1為下一個狀態值;
st為強化學習的狀態空間,狀態空間由5元組表示為:
st=(d1,d2,vh,vt1,vt2);
式中,d1為與匯入車輛相鄰車道相鄰最近的主路的后車距離,d2為與匯入車輛相鄰車道相鄰最近的主路的前車距離,vh為匯入車輛的車速,vt1為與匯入車輛相鄰車道相鄰最近的主路的前車速度,vt2為與匯入車輛相鄰車道相鄰最近的主路的前車速度。
5.根據權利要求4所述的一種基于A3C-SRU的智能車匯入車流方法,其特征在于,at為強化學習的動作空間,動作空間由兩元組表示為:
at=(av,wv)
式中,av表示匯入車輛的加速度變化,wv為匯入車輛方向盤轉角。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聯合大學,未經北京聯合大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010193244.1/1.html,轉載請聲明來源鉆瓜專利網。





