[發明專利]基于貝葉斯學習的無人機集群在線任務規劃方法在審
| 申請號: | 202010230959.X | 申請日: | 2020-03-27 |
| 公開(公告)號: | CN111367317A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 周鑫;王維平;黃美根;王濤;李小波;井田;楊松;王彥鋒;李童心;段婷;劉國杰 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G05D1/10 | 分類號: | G05D1/10 |
| 代理公司: | 重慶項乾光宇專利代理事務所(普通合伙) 50244 | 代理人: | 高姜 |
| 地址: | 410000 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 貝葉斯 學習 無人機 集群 在線 任務 規劃 方法 | ||
本方案涉及一種基于貝葉斯學習的無人機集群在線任務規劃方法。所述方法包括:分別獲取各個無人機的觀察轉移矩陣,無人機根據觀察轉移矩陣實時獲取環境狀態信息;根據環境狀態信息生成環境狀態轉移信息,并根據環境狀態轉移信息生成環境動態函數;通過在線學習算法更新環境動態函數的參數,得到目標環境動態函數;根據目標環境動態函數,通過在線規劃算法規劃各個無人機的任務路徑。通過預先設置好的觀察轉移矩陣可以獲取到未知環境下的環境狀態信息;由于在線學習算法和在線規劃算法適用于具有復雜耦合關系的無人機集群,可在短時間內生成高回報和遠期策略,可以提高無人機集群任務規劃的精度。
技術領域
本發明涉及涉及無人機任務規劃技術領域,特別是涉及一種基于貝葉斯學習 的無人機集群在線任務規劃方法、系統、計算機設備及存儲介質。
背景技術
無人機群是一種典型的多智能體系統,可以自主或遠程控制,無需飛行員即 可執行任務。無人機集群通常用于執行重要任務,例如災情監測、植物保護和軍 事偵察。以災情監測為例,多架無人機可以在災區上空持續巡邏,協調無人機之 間的行動。無人機集群偵察過程可以是:首先收集目標區域的先驗知識,并為無 人機提供環境動態模型;其次,無人機被分配到目標區域并基于算法執行偵察任 務,此時,往往需要派遣無人機集群持續偵察目標環境以提供態勢信息。由于無 人機的工作環境往往是快速動態變化的,特別是在通信不良等復雜條件下,無人 機集群往往需要迅速做出決策并執行行動,因此需要提前對無人機集群進行任務 規劃。
因此,傳統的無人機集群任務規劃方法往往是根據環境動態模型來進行任務 規劃的,由于先驗知識收集和處理是一個艱苦的過程,會面對如延遲、噪音、偏 差和錯誤等信息,導致環境動態模型參數可能是未知的或者不完美的,且在未知 環境中沒有預先建立好環境動態模型時,存在無人機集群收集信息不準確的問 題。
發明內容
基于此,為了解決上述技術問題,提供一種基于貝葉斯學習的無人機集群在 線任務規劃方法、系統、計算機設備及存儲介質,可以提高無人機集群任務規劃 的精度。
一種基于貝葉斯學習的無人機集群在線任務規劃方法,所述方法包括:
分別獲取各個無人機的觀察轉移矩陣,所述無人機根據所述觀察轉移矩陣實 時獲取環境狀態信息;
根據所述環境狀態信息生成環境狀態轉移信息,并根據所述環境狀態轉移信 息生成環境動態函數;
通過在線學習算法更新所述環境動態函數的參數,得到目標環境動態函數;
根據所述目標環境動態函數,通過在線規劃算法規劃各個所述無人機的任務 路徑。
在其中一個實施例中,所述方法還包括:
提取所述環境狀態信息中的環境空間特征;
根據所述環境空間特征確定無人機的運動邊界以及運動頂點;
根據所述運動邊界以及所述運動頂點生成無向圖。
在其中一個實施例中,所述方法還包括:
獲取所述無人機在所述運動頂點處的狀態轉移概率;
所述根據所述環境狀態信息生成環境狀態轉移信息,包括:
根據所述環境狀態信息以及所述狀態轉移概率,生成所述環境狀態轉移信 息。
在其中一個實施例中,所述通過在線學習算法更新所述環境動態函數的參 數,包括:
根據所述觀察轉移矩陣獲取所述無人機在所述運動頂點處的觀察數據,并將 所述觀察數據輸入至所述在線學習算法中;
獲取所述無人機在所述運動頂點處的先驗信念;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010230959.X/2.html,轉載請聲明來源鉆瓜專利網。





