[發明專利]一種多無人機災情探測方法及系統在審
| 申請號: | 202210851483.0 | 申請日: | 2022-07-20 |
| 公開(公告)號: | CN115016540A | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 韓瑜;李錦銘;秦臻;程廣峰;唐兆家 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G05D1/10 | 分類號: | G05D1/10 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 梁嘉琦 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 無人機 災情 探測 方法 系統 | ||
1.一種多無人機災情探測方法,其特征在于,包括:
構建多無人機路徑規劃的問題,以實現對災情探測效果最大化;
將所述多無人機路徑規劃的問題解耦成基于全局航跡規劃的探測點位最大化問題以及基于局部路徑規劃的探測效果最大化問題;
分別對所述基于全局航跡規劃的探測點位最大化問題以及所述基于局部路徑規劃的探測效果最大化問題進行求解,得到所述多無人機路徑規劃的問題的目標解;
根據所述目標解對多無人機進行運動控制,完成災情探測。
2.根據權利要求1所述的一種多無人機災情探測方法,其特征在于,對所述基于全局航跡規劃的探測點位最大化問題的求解過程,包括:
初始化經驗回放池;
初始化train-Q網絡中的參數θtrain和target-Q網絡中的參數θtarget;
初始化系統環境;
將智能體當前所觀測環境的狀態輸入到所述target-Q網絡中,并輸出第一結果q{s,a|θ}a∈A,根據ε-貪婪算法選出動作ai;
配置所述智能體的當前環境觀測狀態si、下一環境觀測狀態si+1以及獎勵回報ri;
將目標數據(si,ai,ri,si+1)存取到經驗回放池中;
當所述經驗回放池存滿數據之后,從中隨機選取K個經驗值;
經過多個時間步數后,將target-Q網絡中的target更新為當前時刻train-Q網絡中的θtrain,直至完成全局航跡規劃的探測點位最大化問題的求解。
3.根據權利要求1所述的一種多無人機災情探測方法,其特征在于,對基于局部路徑規劃的探測效果最大化問題的求解過程,包括:
初始化經驗回放池;
初始化系統化環境;
為每個用戶初始化Critic網絡和Actor網絡其中,Critic網絡的參數為Actor網絡的參數為
為每個用戶初始化targetCritic網絡和targetActor網絡
在初始化階段,為無人機隨機產生一個動作a0,并且觀測到環境給予的回報r0和反饋o1;
然后進入外循環階段,智能體根據當前的策略網絡和觀測到的狀態,生成下一時刻動作at=μ(ot|θμ)+Nt,其中,Nt是添加的探索噪聲,用于鼓勵探索;其中,所述外循環階段的時間參數為t=1,2,...,T;
智能體執行動作at,執行之后觀測到下一刻的狀態反饋ot+1和回報rt;
將目標數據(ot,at,rt,ot+1)儲存到經驗池,同時更新環境給予的反饋ot←ot+1;
對每個智能體i=1,2,...,N循環執行以下步驟:從經驗池中隨機采樣一部分經驗(ot,at,rt,ot+1);
利用梯度下降更新critic網絡的損失;
利用策略梯度法更新actor網絡的損失;
更新target網絡:
退出智能體循環,退出外循環;
完成對基于局部路徑規劃的探測效果最大化問題的求解。
4.根據權利要求1所述的一種多無人機災情探測方法,其特征在于,所述方法還包括:構建無人機探測控制模型,該步驟包括:
計算無人機與目標拍攝點位之間的歐氏距離;
計算無人機與目標拍攝面積之間的重疊度;
計算無人機的相對高度;
根據所述歐氏距離、所述重疊度以及所述相對高度,確定無人機拍攝效果的評價結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210851483.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:汽車的座艙娛樂系統及方法
- 下一篇:一種用于鋰電池荷電狀態估計的快速響應方法





