[發明專利]路徑跟隨方法、系統、電子設備和存儲介質有效

申請號：	201811191784.5	申請日：	2018-10-12
公開（公告）號：	CN110362070B	公開（公告）日：	2022-09-06
發明（設計）人：	高萌;李雨倩;劉懿;李浩	申請（專利權）人：	北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司
主分類號：	G05D1/02	分類號：	G05D1/02
代理公司：	北京律智知識產權代理有限公司 11438	代理人：	袁禮君;闞梓瑄
地址：	100195 北京市海淀區杏石口路6***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	路徑跟隨方法系統電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種路徑跟隨方法，其特征在于，包括以下步驟：

根據柵格地圖，獲得起點柵格至終點柵格的規劃路徑和基于規劃路徑擴展得到的路徑區域，并獲得路徑區域內每個柵格規避障礙物的初始值；

其中，基于規劃路徑擴展得到路徑區域的步驟包括：根據代價地圖獲得柵格地圖的自由移動區域，在自由移動區域中自規劃路徑向兩側擴展預設距離，生成位于規劃路徑的兩側且與規劃路徑相平行的兩條邊界；以兩條邊界為障礙物，生成位于兩條邊界之間的路徑區域，路徑區域內每個柵格具有規避障礙物的初始值；

自起點柵格起遍歷獲得路徑區域內每個柵格基于動作集合中每個動作a_i的代價值，包括：

獲得當前柵格s_n執行每個動作a_i能到達的下一柵格s_n+1的初始值，作為當前柵格s_n基于每個動作a_i的當前收益R_n；

獲得每個下一柵格s_n+1再執行每個動作a_i能到達的再下一柵格s_n+2的初始值中的最大值max(Q(s_n+1,a_i))；

根據當前收益R_n和最大值max(Q(s_n+1,a_i))獲得當前柵格s_n基于每個動作a_i的代價值Q(s_n,a_i)。

2.如權利要求1所述的路徑跟隨方法，其特征在于，還包括步驟：

于當前柵格s_n執行代價值Q(s_n,a_i)中最小代價值對應的動作。

3.如權利要求1所述的路徑跟隨方法，其特征在于，獲得代價值Q(s_n,a_i)的步驟中，根據當前收益R_n和當前柵格s_n基于每個動作a_i的未來收益W_n獲得代價值Q(s_n,a_i)，未來收益W_n＝γ(max(Q(s_n+1,a_i)))，γ為折扣因子，表示犧牲當前收益換取未來收益的程度，0γ1。