[發明專利]一種基于聯合優化的無人機航跡規劃方法有效
| 申請號: | 202110632549.2 | 申請日: | 2021-06-07 |
| 公開(公告)號: | CN113268074B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 高敬鵬;胡欣瑜;葉方;江志燁;毛新蕊;高路;鄭沛;何重航 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G05D1/08 | 分類號: | G05D1/08;G05D1/10 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聯合 優化 無人機 航跡 規劃 方法 | ||
1.一種基于聯合優化的無人機航跡規劃方法,其特征在于,包括以下步驟:
步驟1:搭建飛行狀態優化模型;所述的飛行狀態優化模型的輸入為無人機攜帶的I個傳感器在t時刻對無人機飛行狀態的量測向量mi(t),飛行狀態優化模型的輸出為無人機t時刻飛行狀態的最優估計ζ(t|t)=[p(t),v(t)]T;
步驟1.1:輸入無人機攜帶的I個傳感器在t時刻對無人機飛行狀態的量測向量mi(t);
其中,I個傳感器的采樣間隔均為Ω;mi(t)=[pi(t),vi(t)]T;i={1,2,...,I};pi(t)表示第i個傳感器獲取的無人機位置量測向量,pi(t)=[pix(t),piy(t),piz(t)]T,pix(t)、piy(t)和piz(t)分別表示第i個傳感器獲取的笛卡爾坐標系下無人機在三維空間中x、y和z三個方向的位置坐標量測值;vi(t)表示第i個傳感器獲取的無人機速度量測向量,vi(t)=[vix(t),viy(t),viz(t)]T,vix(t)、viy(t)和viz(t)分別表示第i個傳感器獲取的笛卡爾坐標系無人機在三維空間中x、y和z三個方向的速度分量量測值;
步驟1.2:根據t-1時刻無人機飛行狀態的最優估計ζ(t-1|t-1),計算t時刻無人機飛行狀態的預測ζ(t|t-1);
其中,ζ(t-1|t-1)=[p(t-1),v(t-1)]T;為白噪聲;
步驟1.3:計算t時刻各傳感器對無人機飛行狀態的量測預測δi(t|t-1);
δi(t|t-1)=Hi(t)ζ(t|t-1)
其中,Hi(t)表示第i個傳感器的線性測量矩陣;||·||表示求模運算;
步驟1.4:計算t時刻各傳感器的量測新息εi(t);
εi(t)=mi(t)-δi(t|t-1)
步驟1.5:根據t-1時刻無人機飛行狀態的協方差P(t-1|t-1),計算t時刻無人機飛行狀態的協方差預測P(t|t-1);
P(t|t-1)=FP(t-1|t-1)FT+O
其中,
步驟1.6:計算t時刻各傳感器的預測新息協方差Ii(t);
其中,
步驟1.7:計算t時刻各傳感器量測向量的關聯概率βi(t);
步驟1.8:計算t時刻I個傳感器的綜合量測新息ε(t);
步驟1.9:計算t時刻無人機飛行狀態的協方差P(k|k);
步驟1.10:計算無人機t時刻飛行狀態的最優估計ζ(t|t);
ζ(t|t)=ζ(t|t-1)K(t)ε(t)
步驟2:構建并訓練基于TD3的無人機航跡規劃模型;
設置基于TD3的無人機航跡規劃模型的強化學習狀態空間為st=[pt,vt]T;pt=[px,t,py,t,pz,t]T表示t時刻無人機位置信息;px,t、py,t和pz,t分別代表笛卡爾坐標系下,無人機在三維空間中x、y和z三個方向的位置坐標點;vt=[vx,t,vy,t,vz,t]T為t時刻無人機速度信息,vx,t、vy,t和vz,t分別代表笛卡爾坐標系下,無人機在三維空間中x、y和z三個方向的速度分量;
設置基于TD3的無人機航跡規劃模型的狀態空間輸入為ζ(t|t),設置基于TD3的無人機航跡規劃模型的動作空間的輸出為表示無人機t時刻飛行的方位角,θ(t)表示無人機t時刻飛行的俯仰角;設置強化學習獎勵函數r(t)為:
r(t)=r1(t)+r2(t)
其中,r1表示到達正獎勵;r2表示航程負獎勵;parrive表示終點的位置坐標;pstart表示起點的位置坐標;dmax表示無人機最大探測范圍;ρmax表示無人機攜帶的燃料可供給的最大可飛行航程;
搭建基于TD3的無人機航跡規劃模型,其中Actor網絡和Critic網絡均為3層全連接網絡結構,Actor網絡的輸入層為2個神經元,輸出層為6個神經元,Critic網絡的輸入層為8個神經元,輸出層為1個神經元,設置訓練參數,進行網絡訓練,得到基于TD3的無人機航跡規劃模型;
步驟3:構建并訓練基于隨機森林回歸的飛行動作優化模型;
利用步驟2中訓練好的基于TD3的無人機航跡規劃模型,根據每一時刻基于TD3的無人機航跡規劃模型輸出的動作獲取無人機執行動作a(t)后在t+1時刻到達的位置,將無人機t+1時刻的位置與t時刻的位置連接成標定線,標定線與無人機執行動作a(t)所得航跡構成夾角在直角坐標系中分解,得到構造訓練數據集Angle_data={Angle_datat},訓練好的基于隨機森林回歸的飛行動作優化模型根據輸入的動作a(t)輸出動作偏置
步驟4:聯合飛行狀態優化模型、基于TD3的無人機航跡規劃模型和基于隨機森林回歸的飛行動作優化模型,對無人機航跡進行實時規劃;
步驟4.1:獲取無人機攜帶的I個傳感器在t時刻對無人機飛行狀態的量測向量mi(t),輸入至飛行狀態優化模型中,得到無人機t時刻飛行狀態的最優估計ζ(t|t)=[p(t),v(t)]T;
步驟4.2:將無人機t時刻飛行狀態的最優估計ζ(t|t)輸入至訓練好的基于TD3的無人機航跡規劃模型中,得到動作
步驟4.3:將動作a(t)輸入至訓練好的基于隨機森林回歸的飛行動作優化模型中,得到動作偏置
步驟4.4:計算若則直接輸出動作a(t)來控制無人機飛行;否則,執行步驟4.5;
步驟4.5:優化飛行動作,將原飛行動作a(t)和飛行動作偏置處理,得到新的飛行動作anew(t)來控制無人機飛行:
步驟4.6:在無人機的飛行過程中,實時執行步驟4.1至步驟4.5,實現每一時刻的前端飛行狀態優化和后端飛行動作優化,并實時控制優化后的飛行動作輸出,形成最終航跡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110632549.2/1.html,轉載請聲明來源鉆瓜專利網。





