[發明專利]路徑跟隨方法、系統、電子設備和存儲介質有效
| 申請號: | 201811191784.5 | 申請日: | 2018-10-12 |
| 公開(公告)號: | CN110362070B | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 高萌;李雨倩;劉懿;李浩 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 袁禮君;闞梓瑄 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 路徑 跟隨 方法 系統 電子設備 存儲 介質 | ||
1.一種路徑跟隨方法,其特征在于,包括以下步驟:
根據柵格地圖,獲得起點柵格至終點柵格的規劃路徑和基于規劃路徑擴展得到的路徑區域,并獲得路徑區域內每個柵格規避障礙物的初始值;
其中,基于規劃路徑擴展得到路徑區域的步驟包括:根據代價地圖獲得柵格地圖的自由移動區域,在自由移動區域中自規劃路徑向兩側擴展預設距離,生成位于規劃路徑的兩側且與規劃路徑相平行的兩條邊界;以兩條邊界為障礙物,生成位于兩條邊界之間的路徑區域,路徑區域內每個柵格具有規避障礙物的初始值;
自起點柵格起遍歷獲得路徑區域內每個柵格基于動作集合中每個動作ai的代價值,包括:
獲得當前柵格sn執行每個動作ai能到達的下一柵格sn+1的初始值,作為當前柵格sn基于每個動作ai的當前收益Rn;
獲得每個下一柵格sn+1再執行每個動作ai能到達的再下一柵格sn+2的初始值中的最大值max(Q(sn+1,ai));
根據當前收益Rn和最大值max(Q(sn+1,ai))獲得當前柵格sn基于每個動作ai的代價值Q(sn,ai)。
2.如權利要求1所述的路徑跟隨方法,其特征在于,還包括步驟:
于當前柵格sn執行代價值Q(sn,ai)中最小代價值對應的動作。
3.如權利要求1所述的路徑跟隨方法,其特征在于,獲得代價值Q(sn,ai)的步驟中,根據當前收益Rn和當前柵格sn基于每個動作ai的未來收益Wn獲得代價值Q(sn,ai),未來收益Wn=γ(max(Q(sn+1,ai))),γ為折扣因子,表示犧牲當前收益換取未來收益的程度,0γ1。
4.如權利要求3所述的路徑跟隨方法,其特征在于,獲得代價值Q(sn,ai)的公式為:Q(sn,ai)=Rn+γ(max(Q(sn+1,ai)))。
5.如權利要求1所述的路徑跟隨方法,其特征在于,獲得代價值Q(sn,ai)的步驟還包括:
檢測當前柵格sn是否位于所述路徑區域內,若是則執行獲得當前收益Rn的步驟,若否則自起點柵格起重新遍歷。
6.如權利要求1所述的路徑跟隨方法,其特征在于,遍歷獲得路徑區域內每個柵格基于每個動作ai的代價值的步驟還包括:
實時檢測經過的柵格位置,當經過的柵格位置超出路徑區域,則自起點柵格起重新遍歷。
7.如權利要求1所述的路徑跟隨方法,其特征在于,所述自起點柵格起遍歷獲得路徑區域內每個柵格基于每個動作ai的代價值的步驟包括:
自起點柵格起執行動作集合中的任一動作到達當前柵格sn;
獲得當前柵格sn基于每個動作ai的代價值Q(sn,ai);以及
將當前柵格sn作為起點柵格,遍歷獲得路徑區域內每個柵格基于每個動作ai的代價值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811191784.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:控制機器人的方法
- 下一篇:基于多光譜成像技術的人工智能控制方法及裝置





