[發(fā)明專利]用于領(lǐng)航跟隨型多智能體編隊路徑規(guī)劃的方法和存儲介質(zhì)在審

申請?zhí)枺?/td>	202110985503.9	申請日：	2021-08-26
公開（公告）號：	CN113534819A	公開（公告）日：	2021-10-22
發(fā)明（設(shè)計）人：	劉飛;范之琳;楊洪勇;韓藝琳;寧新順;劉莉;王麗麗;張順寧	申請（專利權(quán)）人：	魯東大學(xué)
主分類號：	G05D1/02	分類號：	G05D1/02
代理公司：	煙臺上禾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 37234	代理人：	齊素立
地址：	264000 山東***	國省代碼：	山東;37
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	用于領(lǐng)航跟隨智能編隊路徑規(guī)劃方法存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種用于領(lǐng)航跟隨型多智能體編隊路徑規(guī)劃的方法，其特征在于，包括：

步驟S1：領(lǐng)航智能體根據(jù)引力勢場法初始化Q值；

步驟S2：所述領(lǐng)航智能體根據(jù)模擬退火法動態(tài)調(diào)整ε貪婪法中的探索概率，進行動作選擇；

步驟S3：所述領(lǐng)航智能體根據(jù)虛擬障礙物填充避障策略和動態(tài)障礙物避障機制規(guī)避障礙物；

步驟S4：所述領(lǐng)航智能體執(zhí)行動作并獲得回報，根據(jù)所述回報更新Q值，所述領(lǐng)航智能體將移動后位置傳輸至跟隨智能體，直至所述領(lǐng)航智能體達到預(yù)設(shè)訓(xùn)練；

步驟S5：所述跟隨智能體獲取到領(lǐng)航智能體當(dāng)前位置信息時，所述跟隨智能體根據(jù)所述領(lǐng)航智能體當(dāng)前位置信息獲取期望目標位置，所述跟隨智能體根據(jù)代價函數(shù)選擇代價最小的狀態(tài)對應(yīng)的動作并執(zhí)行，同時，所述跟隨智能體根據(jù)虛擬障礙物填充避障策略和動態(tài)障礙物避障機制規(guī)避障礙物，并向所述期望目標位置移動；所述跟隨智能體未獲取到領(lǐng)航智能體當(dāng)前位置信息時，所述跟隨智能體路徑規(guī)劃結(jié)束。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟S2中，探索概率ε通過以下公式計算得到：

其中，Q(S，A_random)為狀態(tài)S時隨機選擇動作的Q值，Q(S，A_max)為狀態(tài)S時最優(yōu)動作的Q值，q為非零常數(shù)，T為模擬退火法中的溫度控制參數(shù)。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，計算得到探索概率后，獲取隨機數(shù)，所述探索概率大于所述隨機數(shù)時，所述領(lǐng)航智能體隨機選擇動作；所述探索概率小于等于所述隨機數(shù)時，所述領(lǐng)航智能體選擇當(dāng)前狀態(tài)下最大Q值所對應(yīng)的動作。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟S3進一步包括：

步驟S31：獲取領(lǐng)航智能體當(dāng)前位置的相鄰位置，計算各所述相鄰位置與目標位置之間的第一距離，根據(jù)各所述第一距離判斷所述領(lǐng)航智能體當(dāng)前位置是否趨于凹形障礙物，通過填充規(guī)避障礙物，其中，所述領(lǐng)航智能體當(dāng)前位置與目標位置之間的距離為第二距離；

步驟S32：所述第一距離小于所述第二距離時，判斷當(dāng)前相鄰位置是否是障礙物，所述當(dāng)前相鄰位置不是障礙物時，所述當(dāng)前相鄰位置為可行相鄰位置；

步驟S33：不存在所述可行相鄰位置時，將所述領(lǐng)航智能體當(dāng)前位置填充為虛擬障礙物。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟S4中，所述領(lǐng)航智能體通過以下公式計算獲得的回報，

回報函數(shù)R(S_t，A_t)＝w_c×R_current(S_t，A_t)+w_h×H(S_t，A_t)

其中，S_t為所述領(lǐng)航智能體在t時刻的狀態(tài)；A_t為所述領(lǐng)航智能體在t時刻的動作；R_current(S_t，A_t)為所述領(lǐng)航智能體的當(dāng)前位置回報函數(shù)，

H(S_t，A_t)為啟發(fā)函數(shù)，通過所述領(lǐng)航智能體當(dāng)前位置與目標位置的對角線距離計算得到；w_c為第一系數(shù)為正值；w_h為第二系數(shù)為負值。

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟S1中，通過以下公式進行Q值初始化，

其中，回報值k為比例系數(shù)，γ為折扣因子，ξ為調(diào)節(jié)系數(shù)為負值，ρ_aim(S′)為領(lǐng)航智能體當(dāng)前位置與目標位置之間的距離，η為常數(shù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于魯東大學(xué)，未經(jīng)魯東大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110985503.9/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：短孔深的介孔ZSM-5分子篩及其在制備吡啶堿中的應(yīng)用
下一篇：一種智能插座

同類專利

專利分類

G 物理

G05 控制；調(diào)節(jié)
G05D 非電變量的控制或調(diào)節(jié)系統(tǒng)
G05D1-00 陸地、水上、空中或太空中的運載工具的位置、航道、高度或姿態(tài)的控制，例如自動駕駛儀
G05D1-02 .二維的位置或航道控制
G05D1-04 .高度或深度的控制
G05D1-08 .姿態(tài)的控制，即搖擺、俯仰角或偏航角的控制
G05D1-10 .三維的位置或航道的同時控制
G05D1-12 .尋找目標的控制

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】