[發明專利]基于Q-學習算法的路徑規劃方法有效
| 申請號: | 201810180843.2 | 申請日: | 2018-03-06 |
| 公開(公告)號: | CN108594803B | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 千承輝;馬天錄;劉凱;張宇軒 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 長春市恒譽專利代理事務所(普通合伙) 22212 | 代理人: | 鞠傳龍 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 學習 算法 路徑 規劃 方法 | ||
1.一種基于Q-學習算法的路徑規劃方法,其特征在于:其方法如下所述:
第一步:利用普通攝像頭采集我們實際環境圖像,獲得基本信息;
第二步:MATLAB讀取攝像頭采集的圖片信息,對圖片進行二值化處理,從而確定圖中的障礙物坐標;
第三步:對圖形進行分割處理,為了簡化學習過程我們采用柵格法建立環境模型,我們將上一步的圖片分成10×10的柵格,在程序中判斷,在每一個柵格中如果發現障礙物,則定義該柵格為有障礙物的柵格,機器人不能經過,其他的柵格定義為無障礙物的柵格,機器人可以經過;
第四步:利用改進Q-學習算法規劃路徑,首先定義起始點和終止點,從起點開始利用改進Q-學習算法的學習規則更新Q函數值,直到Q函數收斂為止;改進的Q-學習算法的學習規則如下:
其中,r(s,a)為狀態-動作對s,a的獎勵值,γ∈(0,1)稱為折算因子,max為求最大值函數,α∈(0.5,1]為深度學習因子,s′為下一狀態,a′為下一動作,s″為下兩步狀態,a″為下兩步動作;
第五步:得出最優路徑,根據學習結果用MATLAB繪制出最優的路徑;
第六步:控制機器人行走驗證,根據學習的結果,電腦控制機器人行走對路徑進行驗證。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810180843.2/1.html,轉載請聲明來源鉆瓜專利網。





