[發(fā)明專利]一種基于強化學習的路徑規(guī)劃避障輔助方法有效
| 申請?zhí)枺?/td> | 202010699872.7 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111857142B | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設(shè)計)人: | 藍雪婧;覃誠軒;黃子恒 | 申請(專利權(quán))人: | 廣州大學 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 郭浩輝;麥小嬋 |
| 地址: | 510006 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 強化 學習 路徑 規(guī)劃 輔助 方法 | ||
1.一種基于強化學習的路徑規(guī)劃避障輔助方法,包括如下步驟:
步驟S1,構(gòu)建移動機器人模型,基于Q學習算法對起點到目標點進行路徑規(guī)劃;
步驟S2,當檢測到移動機器人當前處于局部最優(yōu)點時,確定臨時目標點,將所述目標點更改為臨時目標點,并以當前位置為起點,所述臨時目標點為目標點,基于Q學習算法進行路徑規(guī)劃,以向臨時目標點方向移動;
其中,在步驟S2中,當檢測到移動機器人陷入局部最優(yōu)點時,則在角度β±δ上的距離L處創(chuàng)建兩個臨時目標點PR和PL,并基于Q學習算法進行路徑規(guī)劃以使移動機器人往其中任意臨時目標點方向移動,其中,
(Agent.x,Agent.y)為移動機器人當前位置坐標,(Goal.x,Goal.y)為所述目標點的坐標,δ為偏轉(zhuǎn)量,L的值遠遠大于地圖邊長。
2.如權(quán)利要求1所述的一種基于強化學習的路徑規(guī)劃避障輔助方法,其特征在于:δ取值
3.如權(quán)利要求1所述的一種基于強化學習的路徑規(guī)劃避障輔助方法,其特征在于:當檢測到移動機器人再次陷入局部最優(yōu)點時,繼續(xù)交替設(shè)置臨時目標點PR和PL,并基于Q學習算法進行路徑規(guī)劃使移動機器人往臨時目標點方向移動,直到繞過障礙物。
4.如權(quán)利要求1所述的一種基于強化學習的路徑規(guī)劃避障輔助方法,其特征在于:于步驟S2中,當檢測到移動機器人陷入局部最優(yōu)點時,則首先使移動機器人偏移到一側(cè),多次迭代后記錄位置并計算由當前位置和上次記錄位置形成的角度ω,并以為角度在以根據(jù)地圖和步長調(diào)節(jié)的距離處創(chuàng)建臨時目標點,重復此操作,并于此期間基于Q學習算法往不斷變化的臨時目標點方向前進,直到移動機器人與實際目標之間的距離略小于實際目標與局部最優(yōu)點之間的距離;其中,為增量,取值π/6。
5.如權(quán)利要求4所述的一種基于強化學習的路徑規(guī)劃避障輔助方法,其特征在于:于步驟S2,在角度上的距離L處創(chuàng)建臨時目標點并以臨時目標點為目標點前進使移動機器人偏移到一側(cè)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州大學,未經(jīng)廣州大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010699872.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種適用于激光光纖的固相微萃取手柄
- 下一篇:竹材浸煮裝置





