[發明專利]基于生物啟發神經網絡和強化學習的無人艇路徑規劃方法有效
| 申請號: | 202010174346.9 | 申請日: | 2020-03-13 |
| 公開(公告)號: | CN111290398B | 公開(公告)日: | 2022-10-25 |
| 發明(設計)人: | 張濤;夏茂棟;楊波;張晨 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 蔣昱 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生物 啟發 神經網絡 強化 學習 無人 路徑 規劃 方法 | ||
1.基于生物啟發神經網絡和強化學習的無人艇路徑規劃方法,其特征在于,包括如下步驟:
S1:動態調整柵格大小;
所述的步驟S1中考慮無人艇的實際大小,對原始圖片中的柵格進行壓縮;
S2:改進動作集;
所述的步驟S2中動作集設計為上、下、左、右、上左、上右、下左、下右8個動作和動作步長為2個網格長度;
S3:生物啟發神經網絡優化設計獎勵函數;
所述的步驟S3中采用生物啟發神經算法,依據每個點周圍刺激和抑制輸入,計算該點的活性值,將前后的兩點的活性差值作為獎勵值;
S4:設計貪婪策略;
所述的步驟S4中貪婪策略涵蓋初始階段無人艇以大概率隨機搜索,隨著搜索次數不斷累加,隨機搜索的概率不斷降低,最后以最大值為貪婪策略;
S5:訓練樣本,記錄每次訓練的協方差和Q表;
所述的步驟S5中設定初始點和目標點,開始訓練,每次達到最大迭代次數或到達目標點,結束單次循環,每十次記錄最小方差,當小于一定的閾值停止整個訓練過程,保存Q表;
S6:還原路徑;
所述的步驟S6中將規劃完成的路徑中的每一個點進行標記,將壓縮的圖片還原的過程中,只要將標記點進行重新賦值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010174346.9/1.html,轉載請聲明來源鉆瓜專利網。





