日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于多智能體強化學習的多無人機協同空戰機動決策方法有效

專利信息
申請號: 202110318644.5 申請日: 2021-03-25
公開(公告)號: CN112947581B 公開(公告)日: 2022-07-05
發明(設計)人: 楊啟明;張建東;史國慶;吳勇;朱巖;張耀中 申請(專利權)人: 西北工業大學
主分類號: G05D1/10 分類號: G05D1/10
代理公司: 西安凱多思知識產權代理事務所(普通合伙) 61290 代理人: 劉新瓊
地址: 710072 *** 國省代碼: 陜西;61
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 智能 強化 學習 無人機 協同 空戰 機動 決策 方法
【權利要求書】:

1.一種基于多智能體強化學習的多無人機協同空戰機動決策方法,其特征在于,包括以下步驟:

步驟1:建立多機空戰環境模型,定義在多機協同空戰過程中每架無人機進行機動決策的狀態空間、行動空間和獎勵值;

步驟1-1:在地面坐標系中,ox軸取正東方,oy軸取正北方,oz軸取鉛垂方向;在地面坐標系中無人機的運動模型如式(1)所示:

在地面坐標系中,無人機的動力學模型如式(2)所示:

其中,(x,y,z)表示無人機在地面坐標系中的位置,v表示無人機速度,和分別表示無人機速度v在xyz三個坐標軸上的值;航跡角γ表示無人機速度v與水平面o-x-y之間的夾角;航向角ψ表示無人機速度v在o-x-y平面上的投影v′與oy軸之間的夾角,g表示重力加速度;[nx,nz,μ]是控制無人機進行機動的控制變量,nx是無人機速度方向的過載,代表無人機的推力與減速作用;nz表示無人機俯仰方向的過載,即法向過載;μ是圍繞無人機速度矢量的滾轉角;通過nx控制無人機的速度大小,通過nz和μ控制無人機速度矢量的方向,進而控制無人機進行機動動作;

步驟1-2:設定導彈僅具有尾后攻擊能力;在導彈的截獲區域內,用vU和vT分別表示無人機和目標的速度;D為距離矢量,表示無人機與目標間的位置關系;αU和αT分別表示無人機速度矢量與距離矢量D之間的夾角和目標速度矢量與距離矢量D之間的夾角;

設導彈的最遠截獲距離為Dm,視場角為則導彈的截獲區域為一個圓錐區域Ω;無人機在空戰中機動的目標就是讓目標進入無人機的截獲區域ΩU同時避免無人機進入目標的截獲區域ΩT

根據導彈截獲區域的定義,如果目標處于己方導彈的截獲區域,則說明己方能夠發射武器攻擊目標,己方處于優勢,定義無人機截獲目標時的優勢值ηU為:

其中,(xT,yT,zT)表示目標的位置坐標;Re為正數;

定義目標截獲無人機獲得的優勢值ηT為:

其中,(xU,yU,zU)表示無人機的位置坐標;

則空戰中,無人機基于截獲機會獲得的優勢值ηA定義為:

ηA=ηUT (4)

定義基于雙方角度參數與距離參數獲得的優勢值ηB為:

上式表明,當無人機對目標尾追時,優勢值為ηB=1;在無人機被目標尾追時,優勢值為ηB=-1;當無人機與目標的距離大于導彈最遠截獲距離時,優勢值按指數函數衰減;

綜合式式(4)、(5),得出無人機所處空戰的態勢評估函數η為:

η=ηAB (6)

步驟1-3:任意時刻空戰態勢的幾何關系由同一坐標系內的無人機位置矢量、無人機速度矢量、目標位置矢量、目標速度矢量所包含的信息完全確定,因此空戰態勢的描述由以下5個方面組成:

1)無人機的速度信息,包括速度大小vU、航跡角γU和航向角ψU

2)目標的速度信息,包括速度大小vT、航跡角γT和航向角ψT

3)無人機與目標之間的相對位置關系,采用距離矢量D表征;距離矢量的模D=||D||,γD表示距離矢量D與水平面o-x-y的夾角,ψD表示距離矢量D在水平面o-x-y上的投影矢量與oy軸之間的夾角,無人機與目標的相對位置關系用D、γD和ψD表示;

4)無人機與目標之間的相對運動關系,包括無人機速度矢量與距離矢量D之間的夾角αU和目標速度矢量與距離矢量D之間的夾角αT

5)無人機的高度信息zU和目標的高度信息zT;

基于上述1)到5)中的變量能夠完備地表征任意時刻的1v1空戰態勢,因此1v1機動決策模型的狀態空間是一個13維向量空間s:

s=[vUUU,vTTT,D,γDDUT,zU,zT] (7)

采用態勢評估函數η作為空戰機動決策獎勵值R,通過態勢評估函數來反映行動值對空戰態勢的作用,R=η;

步驟1-4:在多機空戰中,設定無人機的數量為n,分別記為UAVi(i=1,2,…,n),目標的數量為m,分別記為Targetj(j=1,2,…,m),設定目標的數量不大于無人機的數量,即m≤n;

記任意兩個UAVi和Targetj間的相對狀態為UAVi與任意一個友機UAVk之間的相對狀態記為則多機空戰中任意一架UAVi的觀測狀態為:

Si=[∪sij|j=1,2...,m,∪sik|k=1,2,...,n(k≠i)] (8)

在多機空戰過程中,每架無人機根據自己在空戰環境中所處的態勢做出自己的機動決策,根據式(2)所述的無人機動力學模型,無人機通過nx、nz和μ三個變量控制飛行,因此UAVi的行動空間為Ai=[nxi,nzii];

在多機協同空戰中,按照式(4)和式(5)分別計算每個無人機與每個目標之間的態勢評估值ηA和ηB,記UAVi與Targetj間的態勢評估值為和除此之外,考慮UAVi與友機UAVk的相對狀態對自身態勢的影響,因此定義UAVi與友機UAVk的態勢評估函數為:

其中Dik為無人機UAVi與友機UAVk之間的距離,Dsafe為兩架無人機之間的最小安全距離,P為正數;

步驟2:建立多機協同目標分配方法,確定強化學習訓練時的目標分配規則;

步驟2-1:在空戰中,設n架無人機迎戰m架目標,且n≥m;根據式(6),UAVi(i=1,2,…,n)相對Targetj(j=1,2,…,m)的態勢評估值為

設目標分配矩陣為X=[xij],xij=1表示Targetj分配給UAVi,xij=0表示Targetj沒有分配給UAVi;設每個無人機最多能同時對處于其攻擊區內的L個目標發射導彈,即同時,作戰時要避免有目標被遺漏而放棄攻擊,即每個目標均應至少分配一個無人機去攻擊,因此而所有無人機均要投入戰斗,因此

以無人機對目標的態勢優勢最大化為目標,建立目標分配模型如下:

步驟2-2:在目標分配過程中首先分配處于攻擊區內的目標,然后再分配處于攻擊區以外的目標,因此目標分配方法分為如下兩個部分:

步驟2-2-1:優先分配位于攻擊區內的目標;

以和為元素構建兩個n×m維的矩陣HA和HB,由式(3),如果Targetj處于UAVi的攻擊區內,則否則因此,令令所有零元素的對應位置的xij=1;在分配過程中,如果處于無人機UAVi攻擊區內的目標個數χ超過了無人機的最大攻擊目標數量,即χL,則將UAVi在HB矩陣中對應的元素值排序,選擇其中元素值最大的L個目標分配給UAVi

步驟2-2-2:分配位于攻擊區以外的目標;

對于UAVi,如果已經分配了處于其攻擊區內的目標,則不能再向其分配攻擊區外的目標;而對于攻擊區外的多個目標,無人機無法做出機動使得多個目標處于攻擊區內,因而當目標均在攻擊區之外時,只能為無人機分配一個目標;因此,在完成攻擊區內目標分配后,剩余的目標分配工作轉變為未分配的無人機分配1個目標的過程,采用匈牙利算法實現分配,具體如下:

首先根據當前的目標分配矩陣X=[xij]n×m,將HB中所有xij=1所在的第i行和第j列刪除,獲得矩陣基于采用匈牙利算法計算分配結果,由于n≥m,且L0,采用補邊法完成匈牙利算法,實現目標分配,令相應xij=1;

完成以上兩步后,即完成了所有目標的分配,得到目標分配矩陣X=[xij]n×m;

步驟3:設計多機協同機動策略學習算法,確定強化學習訓練邏輯;

多機協同機動策略學習算法包括策略協調機制和策略學習機制兩部分:

步驟3-1:設計策略協調機制;

將空戰對抗看作n個無人機與m個目標之間的競爭博弈,基于隨機博弈的框架建立模型,一個隨機博弈可以用一個元組來表示;S表示當前博弈的狀態空間,所有Agent都能共享;UAVi的行動空間定義為Ai,Targeti的行動空間定義為Bi;T:S×An×Bm→S表示環境的確定性轉移函數,表示UAVi的獎勵值函數;在協同空戰中各自編隊內無人機的行動空間相同,即對于UAVi和Targetj分別有Ai=A和Bi=B;

定義無人機編隊的全局獎勵值為各個無人機獎勵值的平均值,即:

其中,r(s,a,b)表示在t時刻、環境狀態為s、無人機編隊采取行動a∈An、目標編隊采取行動b∈Bm的情況下,無人機編隊獲得的獎勵值;

無人機編隊的目標是學習一個策略使得獎勵值的折扣累加值的期望最大化,其中0λ≤1是折扣因子;將隨機博弈轉變為一個馬爾科夫決策問題:

其中Q*(·)表示狀態s下執行行動a的狀態-動作值函數,r(s,a)表示狀態s下的執行行動a獲得的獎勵值,θ表示策略函數的網絡參數,s′表示下一時刻的狀態,aθ表示參數化的策略函數;

定義每架無人機的獎勵值函數為:

其中,ri(s,a,b)表示在t時刻、環境狀態為s、無人機編隊采取行動a∈An、目標編隊采取行動b∈Bm的情況下,UAVi獲得的獎勵值,其中表征UAVi相對為其分配的目標的態勢優勢值,是懲罰項,用以約束UAVi與友機之間的距離;

基于式(13),對于n架無人機個體,有n個如式(14)所示的貝爾曼方程,其中的策略函數aθ擁有相同的參數θ:

其中,表示無人機UAVi在狀態s下的執行行動a的狀態-動作值函數,ri(s,a)表示無人機UAVi在狀態s下的執行行動a獲得的獎勵值;

步驟3-2:設計策略學習機制;

采用雙向循環神經網絡BRNN建立多無人機機動決策模型;

多無人機空戰機動決策模型由Actor網絡和Critic網絡組成,Actor網絡由各個無人機個體的Actor網絡通過BRNN連接而成,Critic網絡由各個無人機個體的Critic網絡通過BRNN連接而成;多無人機空戰機動決策模型中將單無人機決策模型中策略網絡Actor和Q網絡Critic中的隱含層設置成為BRNN的循環單元,再按照無人機的數量將BRNN展開;多無人機空戰機動決策模型的輸入為當前空戰態勢,輸出各個無人機的行動值;

定義UAVi的目標函數為表示個體獎勵值ri的累加的期望,表示在狀態轉移函數T下采用行動策略aθ得到的狀態分布,狀態分布在遍歷的馬爾可夫決策過程中為平穩分布,所以將n個無人機的目標函數記為J(θ):

根據多智能體確定性策略梯度定理,對于式(15)所述的n個無人機的目標函數J(θ),其策略網絡參數θ的梯度為

采用參數化的Critic函數Qξ(s,a)來估計式(16)中的狀態-行動值函數在訓練Critic時,采用平方和loss函數,計算參數化critic函數Qξ(s,a)的梯度如式(17)所示,其中ξ是Q網絡的參數:

基于式(16)和(17),采用隨機梯度下降法優化Actor和Critic網絡;在交互學習的過程中,通過試錯獲取的數據更新參數,完成協同空戰策略的學習優化;

步驟3-3:根據策略協調機制和策略學習機制,確定多無人機協同空戰機動決策模型的強化學習訓練過程如下:

步驟3-3-1:首先進行初始化:確定空戰雙方的兵力和態勢,設有n架無人機和m架目標進行空戰對抗,n≥m;隨機初始化Actor的在線網絡參數θ和Critic的在線網絡的參數ξ,然后將Actor和Critic在線網絡的參數分別賦給其相應目標網絡的參數,即θ′←θ,ξ′←ξ,θ′和ξ′分別是Actor和Critic目標網絡的參數;初始化經驗池R1,用以保存探交互得到的經驗數據;初始化一個隨機過程ε,用于實現行動值的探索;

步驟3-3-2:確定訓練的初始狀態,即確定空戰開始的雙方相對態勢;設定無人機編隊和目標編隊中每一架無人機的初始位置信息和速度信息,即確定每架無人機的(x,y,z,v,γ,ψ)信息,根據狀態空間的定義,計算得出空戰初始狀態s1;令t等于1;

步驟3-3-3:根據初始狀態重復進行多幕訓練,在每一單幕空戰仿真中執行如下操作:

首先根據當前空戰狀態st,基于目標分配方法計算出目標分配矩陣Xt;然后每一個UAVi根據狀態st和隨機過程ε生成行動值并執行,與此同時,目標編隊中的每一個Targeti執行行動執行完后狀態轉移至st+1,根據式(13)計算獲得獎勵值將一次轉移過程變量作為一條經驗數據存入經驗池R1中;在學習時,從經驗池R1中隨機采樣一批M條經驗數據計算各個無人機的目標Q值,即對于M條數據中的每一條,都有:

根據式(17)計算Critic的梯度估計值,有:

根據式(16)計算Actor的梯度估計值,有:

根據得到的梯度估計值△ξ和△θ,采用優化器對Actor和Critic的在線網絡參數進行更新;完成在線網絡優化后,采用軟更新方式更新目標網絡參數,即

其中κ∈(0,1);

步驟3-3-4:在單幕仿真結束后,如果仿真達到設定的最大幕數,則停止本次強化學習訓練,否則令t加1,重復執行步驟3-3-3。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110318644.5/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: **毛片在线| xxxx国产一二三区xxxx| 亲子乱子伦xxxx| 又黄又爽又刺激久久久久亚洲精品 | 99精品偷拍视频一区二区三区| 中文字幕av一区二区三区高| 国产精品二区一区| 亚洲精品suv精品一区二区| 男女视频一区二区三区| 精品久久久久久中文字幕| 精品国产九九| 狠狠色噜噜狠狠狠888奇米| 久久久久久亚洲精品中文字幕| 亚洲精品乱码久久久久久蜜糖图片| 中文字幕日本一区二区| 91亚洲欧美日韩精品久久奇米色| 精品国产91久久久久久久| 国产精品19乱码一区二区三区| 91麻豆产精品久久久| 日韩亚洲精品视频| 神马久久av| 欧美日韩一区二区三区69堂| 国产高清在线观看一区| 午夜伦全在线观看| 午夜毛片电影| 亚洲欧美日韩在线看| 国产日韩精品一区二区三区| 亚洲网久久| 欧美日韩精品中文字幕| 一色桃子av大全在线播放| 亚洲欧美一区二区三区不卡| 99精品黄色| 96国产精品视频| xxxx18hd护士hd护士| 国产女性无套免费看网站| 美国三级日本三级久久99| 国产精品三级久久久久久电影| 扒丝袜pisiwa久久久久| 精品国产一区二区三| 三级午夜片| 国产乱人伦偷精品视频免下载| 欧美资源一区| 91片在线观看| 在线视频不卡一区| 精品在线观看一区二区| 国产一级一区二区三区| 一本大道久久a久久精品| 国内精品久久久久久久星辰影视| 热re99久久精品国99热蜜月| 国产一级片大全| 日本伦精品一区二区三区免费| 久免费看少妇高潮a级特黄按摩| www.久久精品视频| 波多野结衣女教师电影| 欧美日韩精品影院| 国产精品视频十区| 亚洲欧美v国产一区二区| 国产精品入口麻豆九色| 激情aⅴ欧美一区二区三区| 亚洲国产99| 91精品资源| 亚洲精品久久久久玩吗| 欧美大片一区二区三区| 久久久久国产精品www| 欧美午夜一区二区三区精美视频| 国产精品无码永久免费888| 色婷婷久久一区二区三区麻豆| 最新国产精品久久精品| 一区二区中文字幕在线观看| 国内少妇自拍视频一区| 久久国产麻豆| 欧美日韩久久一区| 亚洲欧美国产日韩综合| 亚洲精品日韩在线| 亚洲区日韩| 日本一二区视频| 日韩av中文字幕在线| 日韩一区免费| 国产精品欧美久久| 国产麻豆91视频| 91久久精品在线| 91精品啪在线观看国产线免费| 91久久国语露脸精品国产高跟| 夜夜嗨av一区二区三区中文字幕| 中日韩欧美一级毛片| 亚洲福利视频二区| 狠狠色噜噜狠狠狠合久| 国产日韩欧美一区二区在线观看 | 国产精品一区二区人人爽| 天堂av一区二区| 欧洲在线一区| 鲁丝一区二区三区免费观看| 日韩精品免费播放| 99国产精品免费| 国产91清纯白嫩初高中在线观看| 午夜精品一二三区| 亚洲欧美日韩国产综合精品二区| 狠狠色噜噜狠狠狠色综合| 国产精品久久久av久久久| 欧美精品免费视频| 亚洲国产99| 国产精品久久久久四虎| 午夜免费av电影| 一区二区三区国产精品视频| 国产一区精品在线观看| 99精品国产99久久久久久97| 偷拍久久精品视频| 玖玖国产精品视频| 欧美精品中文字幕在线观看| 国产一区二区高潮| 亚洲国产精品国自产拍久久| 浪潮av色| 视频一区二区国产| 色天天综合久久久久综合片| a级片一区| 国产精品剧情一区二区三区| 国产在线拍揄自揄拍| 97一区二区国产好的精华液| 岛国黄色网址| 午夜精品99| 亚洲欧美中日精品高清一区二区| 国产午夜精品一区二区三区视频| 国产在线不卡一区| 国产精品96久久久| 国产欧美日韩二区| 四虎国产永久在线精品| 91精品一区在线观看| xxxx国产一二三区xxxx| 久久er精品视频| 国产精品午夜一区二区| 欧美激情精品一区| 亚洲区在线| 日韩精品免费一区二区在线观看| 96国产精品| 国产男女乱淫视频高清免费| 国产人成看黄久久久久久久久| 欧美精品二区三区| 日本精品在线一区| 激情久久一区二区三区| 狠狠色噜噜狠狠狠狠| 亚洲精品国产setv| 国产91丝袜在线熟| 日韩精品一区在线视频| 久久国产激情视频| 99国产精品丝袜久久久久久| 欧美精品xxxxx| 国产一区二区中文字幕| 久久综合国产伦精品免费| 中文字幕一区二区三区免费| 激情久久综合网| 久久精品国产精品亚洲红杏| 国产精品一区二区久久乐夜夜嗨| 久久久99精品国产一区二区三区| 日韩av在线导航| 夜夜嗨av禁果av粉嫩av懂色av| 国产日韩一二三区| 国产在线一卡二卡| 国产精品一级在线| 国产欧美日韩中文字幕| 欧美一区久久| 96国产精品视频| 精品国产亚洲一区二区三区| 午夜色大片| 中文字幕视频一区二区| 亚洲欧美一区二区精品久久久| 一区二区精品久久| 最新av中文字幕| 亚洲精品91久久久久久| 欧美精品粉嫩高潮一区二区| av午夜影院| 97久久精品人人做人人爽| 亚日韩精品| 国产乱人乱精一区二视频国产精品| 一区二区欧美视频| av素人在线| 猛男大粗猛爽h男人味| 国产高清精品一区二区| 国产日韩欧美91| 日韩av在线电影网| 在线观看国产91| 亚洲精品乱码久久久久久高潮| 国产精品偷伦一区二区| 福利视频亚洲一区| 国产特级淫片免费看| 欧美一区二区三区激情视频| 精品国产一二区| 日韩av在线网址| 国偷自产中文字幕亚洲手机在线| 在线视频国产一区二区| 亚洲区在线| 91久久国产露脸精品国产| 亚洲精品老司机| 欧美一区二区精品久久| 日韩精品久久久久久久电影99爱| 欧美在线播放一区| 91麻豆精品国产91久久久无限制版| 中文字幕一区2区3区| 久久久综合亚洲91久久98| 欧美一区二区激情三区| 日本高清一二三区| 国产欧美一区二区精品久久久| 国产一二三区免费| 免费高潮又黄又色又爽视频| 国产69精品久久久久按摩| 国产精品入口麻豆九色| 午夜特级片| 精品国产一区二| 91视频一区二区三区| 91精品免费观看| 亚洲国产精品国自产拍久久| 91丝袜国产在线播放| 欧美精品五区| 99爱精品视频| 狠狠色丁香久久婷婷综| 国产欧美精品一区二区三区小说 | 国产精品久久久久久久久久软件| 欧美精品国产一区二区| 久久久一区二区精品| 国产精品自产拍在线观看蜜| 97国产精品久久| 国产精品网站一区| 国产精品videossex国产高清| 真实的国产乱xxxx在线91| 午夜影院你懂的| 99久久婷婷国产综合精品草原| 91丝袜国产在线观看| 欧美视屏一区| 97欧美精品| 91日韩一区二区三区| 4399午夜理伦免费播放大全| 亚洲国产精品美女| 久久精品视频3| 亚洲久久在线| 国产精品综合一区二区三区| 一区二区久久久久| 国产午夜精品一区二区三区在线观看 | 日韩a一级欧美一级在线播放| 精品一区电影国产| 精品国产乱码久久久久久久| 国产精品第56页| 淫片免费看| 91国偷自产中文字幕婷婷| 午夜天堂电影| 国产极品美女高潮无套久久久| 久久精品—区二区三区| 久久国产精品久久久久久电车|