[發(fā)明專利]一種舞臺環(huán)境下的移動智能體動態(tài)路徑規(guī)劃方法在審

申請?zhí)枺?/td>	202210465123.7	申請日：	2022-04-29
公開（公告）號：	CN114815834A	公開（公告）日：	2022-07-29
發(fā)明（設(shè)計）人：	劉安東;張柏鑫;倪洪杰;曹瀚仁	申請（專利權(quán)）人：	浙江工業(yè)大學(xué)
主分類號：	G05D1/02	分類號：	G05D1/02
代理公司：	杭州浙科專利事務(wù)所(普通合伙) 33213	代理人：	湯明
地址：	310014 浙***	國省代碼：	浙江;33
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種舞臺環(huán)境移動智能動態(tài) 路徑規(guī)劃方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種舞臺環(huán)境下的移動智能體動態(tài)路徑規(guī)劃方法，其特征在于，包括以下步驟：

1)基于gym庫建立移動智能體和動靜態(tài)障礙物的仿真環(huán)境模型；

2)設(shè)計馬爾可夫決策過程,馬爾可夫決策過程通過五元組表示S,A,P,R,γ，設(shè)計狀態(tài)空間S、動作空間A、轉(zhuǎn)移概率P、獎勵R和折扣因子γ；

3)設(shè)計神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)；

4)使用最佳互惠碰撞避免算法ORCA，通過模仿學(xué)習(xí)預(yù)訓(xùn)練來初始化網(wǎng)絡(luò)參數(shù)；模仿學(xué)習(xí)結(jié)束之后然后通過移動智能體在仿真環(huán)境下的實際交互進(jìn)行訓(xùn)練來優(yōu)化網(wǎng)絡(luò)參數(shù)；

5)通過自適應(yīng)時刻估計方法Adam訓(xùn)練神經(jīng)網(wǎng)絡(luò)得到最優(yōu)值函數(shù)：

V^*(u_t)＝∑γ^Δt·Vpref·P(u_t,a_t)

6)通過最大化累計回報來設(shè)定最優(yōu)策略：

其中，u_t表示當(dāng)前移動智能體和障礙物的聯(lián)合狀態(tài)，a_t表示動作空間的集合，γ表示衰減因子，Δt表示兩個動作之間的時間間隔，Vpref表示首選速度，V^*表示在最優(yōu)值函數(shù)，P表示為狀態(tài)轉(zhuǎn)移函數(shù)，R表示為獎勵函數(shù)；表示下一時刻的聯(lián)合狀態(tài)；

7)根據(jù)最優(yōu)策略來選擇當(dāng)前時刻的動作a_t直到移動智能體到達(dá)目標(biāo)。

2.根據(jù)權(quán)利要求1所述的一種舞臺環(huán)境下的移動智能體動態(tài)路徑規(guī)劃方法，其特征在于，所述步驟1)中基于gym庫建立仿真環(huán)境模型，將移動智能體和動態(tài)障礙物設(shè)定為半徑為0.3米的圓，而將靜態(tài)障礙物定義為半徑在0.5米到1米之間的圓形或者為面積在1平方米到1.5平方米之間的四邊形。

3.根據(jù)權(quán)利要求1所述的一種舞臺環(huán)境下的移動智能體動態(tài)路徑規(guī)劃方法，其特征在于，所述步驟2)中，設(shè)定狀態(tài)空間S，其中動態(tài)障礙物的狀態(tài)為S_D＝[P_x,P_y,V_x,V_y,r,V_pref]、靜態(tài)障礙物的狀態(tài)為S_S＝[P_x,P_y,r]、移動智能體的狀態(tài)為S_T＝[P_x,P_y,G_x,G_y,V_x,V_y,θ,r,V_pref]、聯(lián)合狀態(tài)u_t＝[S_T,S_S,S_D]；其中(P_x,P_y)為移動智能體和動靜態(tài)障礙物的當(dāng)前位置，(G_x,G_y)為所設(shè)定的目標(biāo)點的位置，θ為移動智能體的航向角，r為移動智能體和動靜態(tài)障礙物的半徑大小，V_pref為移動智能體的首選速度，(V_x,V_y)為移動智能體和動態(tài)障礙物的移動速度；

動作空間A為線速度和角速度，為了符合動力學(xué)約束，角速度分成18等分在[-π/4,π/4]區(qū)間內(nèi)，線速度按照指數(shù)函數(shù)x取1，2，3，4，5可獲得5個變化平滑的線速度；動作空間共有90種動作組合；

轉(zhuǎn)移概率P通過移動智能體在仿真環(huán)境下的實際交互來轉(zhuǎn)移狀態(tài)；獎勵R設(shè)置為：

其中G_x,y是目標(biāo)點的位置信息，P_x,y是移動智能體的當(dāng)前位置信息，d_s是移動智能體和靜態(tài)障礙物之間的距離，d_d是移動智能體和動態(tài)障礙物之間的距離。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué)，未經(jīng)浙江工業(yè)大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210465123.7/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G05 控制；調(diào)節(jié)
G05D 非電變量的控制或調(diào)節(jié)系統(tǒng)
G05D1-00 陸地、水上、空中或太空中的運(yùn)載工具的位置、航道、高度或姿態(tài)的控制，例如自動駕駛儀
G05D1-02 .二維的位置或航道控制
G05D1-04 .高度或深度的控制
G05D1-08 .姿態(tài)的控制，即搖擺、俯仰角或偏航角的控制
G05D1-10 .三維的位置或航道的同時控制
G05D1-12 .尋找目標(biāo)的控制

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】