[發明專利]多無人機隊形變換方法及系統有效
| 申請號: | 202210025528.9 | 申請日: | 2022-01-11 |
| 公開(公告)號: | CN114326826B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 邢娜;王月海;尹文杰;邢志強;龐楓騫 | 申請(專利權)人: | 北方工業大學 |
| 主分類號: | G05D1/12 | 分類號: | G05D1/12 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 劉芳 |
| 地址: | 100144 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無人機 隊形 變換 方法 系統 | ||
1.一種多無人機隊形變換方法,其特征在于,所述方法包括:
建立適用于多無人機隊形變換的馬爾科夫決策模型;所述馬爾科夫決策模型具體包括:
狀態空間:包括無人機本體的狀態,與無人機本體相鄰的其他無人機的狀態,以及無人機本體和其他無人機的聯合狀態;
動作空間:由80個離散的動作組成,所述80個離散的動作包括由[0,2π]平均分成的16個方向以及由[0,vpref)區間的速度指數分割的5個區間,其中vpref為最佳速度;
回報函數:
式中,at是無人機在隊形變換過程中執行的動作,為無人機本體和其他無人機的聯合狀態值,為無人機本體動作選擇的回報值,dt為[t-Δt,t]時間段內無人機本體與其他無人機最小分距離,pg為目標位置;
狀態轉移概率:表示S×A→Sp的轉移概率;P(st+1|st,a)表示在狀態st下采取行動a狀態轉移到st+1的概率;
折扣因子:γ∈(0,1);
基于注意力機制以及深度價值網絡算法計算馬爾科夫決策模型的最優解,具體包括:
采集鄰居無人機的狀態動作信息,所述鄰居無人機為與無人機本體相鄰的無人機;
對無人機本體的狀態動作信息以及所述鄰居無人機的狀態動作信息進行預處理,得到所述無人機本體和所述鄰居無人機的聯合狀態特征向量;
根據所述聯合狀態特征向量和所述注意力機制獲得注意得分;
根據所述聯合狀態特征向量和所述注意得分,獲得綜合特征值;
利用所述綜合特征值和無人機本體的狀態獲得狀態價值函數;
利用深度價值網絡算法對所述狀態價值函數進行迭代更新,得到最優狀態價值函數;
根據最優狀態價值函數獲得無人機本體的最優動作選擇,無人機本體的最優動作選擇即為所述馬爾科夫決策模型的最優解。
2.根據權利要求1所述的方法,其特征在于,所述對無人機本體的狀態動作信息以及所述鄰居無人機的狀態動作信息進行預處理,得到所述無人機本體和所述鄰居無人機的聯合狀態特征向量,具體包括:
構造一個地圖張量;
將所述地圖張量、動態障礙物的狀態以及無人機本體的狀態輸入到第一層多層感知機,得到無人機本體與動態障礙物的第一成對特征向量,所述第一成對特征向量為一個定長向量,所述動態障礙物為與無人機本體相鄰的其他無人機;
將所述第一成對特征向量輸入到第二層多層感知機,獲得無人機本體與動態障礙物的第二成對特征向量,所述第一成對特征向量和所述第二成對特征向量均為聯合狀態特征向量。
3.根據權利要求2所述的方法,其特征在于,所述根據所述聯合狀態特征向量和所述注意力機制獲得注意得分的公式為:
αi=ψα(ei,em;Wα)
式中,ei為第一成對特征向量,所述第一成對特征向量為一個定長向量,em是與定長向量ei相同長度的嵌入向量,em是通過對ei-j算術平均獲得的,ψα(·)是一個多層感知機,具有ReLU激活函數和權重Wα,αi是指注意得分。
4.根據權利要求2或3所述的方法,其特征在于,所述根據所述聯合狀態特征向量和所述注意得分,獲得綜合特征值,具體包括:對所述第二成對特征向量和所述注意得分進行加權線性組合,得到綜合特征值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北方工業大學,未經北方工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210025528.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種超柔經編布染色工藝
- 下一篇:一種基于多層編碼網絡的謠言檢測方法及系統





