[發(fā)明專利]用于領(lǐng)航跟隨型多智能體編隊路徑規(guī)劃的方法和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110985503.9 | 申請日: | 2021-08-26 |
| 公開(公告)號: | CN113534819A | 公開(公告)日: | 2021-10-22 |
| 發(fā)明(設(shè)計)人: | 劉飛;范之琳;楊洪勇;韓藝琳;寧新順;劉莉;王麗麗;張順寧 | 申請(專利權(quán))人: | 魯東大學(xué) |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 煙臺上禾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 37234 | 代理人: | 齊素立 |
| 地址: | 264000 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 領(lǐng)航 跟隨 智能 編隊 路徑 規(guī)劃 方法 存儲 介質(zhì) | ||
1.一種用于領(lǐng)航跟隨型多智能體編隊路徑規(guī)劃的方法,其特征在于,包括:
步驟S1:領(lǐng)航智能體根據(jù)引力勢場法初始化Q值;
步驟S2:所述領(lǐng)航智能體根據(jù)模擬退火法動態(tài)調(diào)整ε貪婪法中的探索概率,進行動作選擇;
步驟S3:所述領(lǐng)航智能體根據(jù)虛擬障礙物填充避障策略和動態(tài)障礙物避障機制規(guī)避障礙物;
步驟S4:所述領(lǐng)航智能體執(zhí)行動作并獲得回報,根據(jù)所述回報更新Q值,所述領(lǐng)航智能體將移動后位置傳輸至跟隨智能體,直至所述領(lǐng)航智能體達到預(yù)設(shè)訓(xùn)練;
步驟S5:所述跟隨智能體獲取到領(lǐng)航智能體當(dāng)前位置信息時,所述跟隨智能體根據(jù)所述領(lǐng)航智能體當(dāng)前位置信息獲取期望目標位置,所述跟隨智能體根據(jù)代價函數(shù)選擇代價最小的狀態(tài)對應(yīng)的動作并執(zhí)行,同時,所述跟隨智能體根據(jù)虛擬障礙物填充避障策略和動態(tài)障礙物避障機制規(guī)避障礙物,并向所述期望目標位置移動;所述跟隨智能體未獲取到領(lǐng)航智能體當(dāng)前位置信息時,所述跟隨智能體路徑規(guī)劃結(jié)束。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S2中,探索概率ε通過以下公式計算得到:
其中,Q(S,Arandom)為狀態(tài)S時隨機選擇動作的Q值,Q(S,Amax)為狀態(tài)S時最優(yōu)動作的Q值,q為非零常數(shù),T為模擬退火法中的溫度控制參數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,計算得到探索概率后,獲取隨機數(shù),所述探索概率大于所述隨機數(shù)時,所述領(lǐng)航智能體隨機選擇動作;所述探索概率小于等于所述隨機數(shù)時,所述領(lǐng)航智能體選擇當(dāng)前狀態(tài)下最大Q值所對應(yīng)的動作。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S3進一步包括:
步驟S31:獲取領(lǐng)航智能體當(dāng)前位置的相鄰位置,計算各所述相鄰位置與目標位置之間的第一距離,根據(jù)各所述第一距離判斷所述領(lǐng)航智能體當(dāng)前位置是否趨于凹形障礙物,通過填充規(guī)避障礙物,其中,所述領(lǐng)航智能體當(dāng)前位置與目標位置之間的距離為第二距離;
步驟S32:所述第一距離小于所述第二距離時,判斷當(dāng)前相鄰位置是否是障礙物,所述當(dāng)前相鄰位置不是障礙物時,所述當(dāng)前相鄰位置為可行相鄰位置;
步驟S33:不存在所述可行相鄰位置時,將所述領(lǐng)航智能體當(dāng)前位置填充為虛擬障礙物。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S4中,所述領(lǐng)航智能體通過以下公式計算獲得的回報,
回報函數(shù)R(St,At)=wc×Rcurrent(St,At)+wh×H(St,At)
其中,St為所述領(lǐng)航智能體在t時刻的狀態(tài);At為所述領(lǐng)航智能體在t時刻的動作;Rcurrent(St,At)為所述領(lǐng)航智能體的當(dāng)前位置回報函數(shù),
H(St,At)為啟發(fā)函數(shù),通過所述領(lǐng)航智能體當(dāng)前位置與目標位置的對角線距離計算得到;wc為第一系數(shù)為正值;wh為第二系數(shù)為負值。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S1中,通過以下公式進行Q值初始化,
其中,回報值k為比例系數(shù),γ為折扣因子,ξ為調(diào)節(jié)系數(shù)為負值,ρaim(S′)為領(lǐng)航智能體當(dāng)前位置與目標位置之間的距離,η為常數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于魯東大學(xué),未經(jīng)魯東大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110985503.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





