[發明專利]一種基于情景構建的無人機自主魯棒決策方法有效
| 申請號: | 201310455107.0 | 申請日: | 2013-09-29 |
| 公開(公告)號: | CN103488171A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 胡笑旋;陳意;羅賀;馬華偉;靳鵬;夏維 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G05D1/00 | 分類號: | G05D1/00 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 何梅生 |
| 地址: | 230009 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 情景 構建 無人機 自主 決策 方法 | ||
1.一種基于情景構建的無人機自主魯棒決策方法,是應用于紅方無人機攻打位于藍方陣地中的藍方高價值目標的復雜戰場環境中,其特征在于,所述無人機自主魯棒決策方法按如下步驟進行:
步驟1:定義復雜戰場環境中紅方無人機的決策變量和藍方陣地的決策變量
令紅方無人機攜帶電子支援措施狀態Red_ESMState={開,關}、紅方無人機攜帶SAR雷達狀態Red_SARState={開,關}、紅方無人機機載導彈類型Red_Missile={A,B}、紅方無人機飛行高度Red_Height={中,低}、紅方無人機發現藍方高價值目標位置Red_GetLocation={是,否}、紅方無人機被擊中Red_Destroyed={是,否}、紅方無人機攻擊效果Red_Result={藍方高價值目標完全損毀,藍方高價值目標高度損毀,藍方高價值目標中度損毀,藍方高價值目標未損毀}、紅方無人機決策候選行動方案集Red_Action={D1,D2,...,Di,...,Dn},n∈N,N為自然數,所述紅方無人機決策候選行動方案集Red_Action中,Di為第i種紅方無人機決策候選行動方案,i∈n;紅方無人機攻打藍方陣地的效用={Utility};
令藍方雷達狀態Blue_RadarState={開,關}、藍方電子干擾設備狀態Blue_ECMState={開,關}、藍方高炮Blue_HasAA={是,否}、藍方導彈類型Blue_Missile={中程導彈,近程導彈,無導彈}、藍方發現紅方無人機位置Blue_GetLocation={是,否};
令紅方無人機與藍方高價值目標之間的距離Distance={遠,中,近};
步驟2:情景構建
利用所述紅方無人機攜帶電子支援措施狀態Red_ESMState、所述紅方無人機攜帶SAR雷達狀態Red_SARState、所述紅方無人機機載導彈類型Red_Missile、所述紅方無人機飛行高度Red_Height、所述藍方雷達狀態Blue_RadarState、所述藍方電子干擾設備狀態Blue_ECMState、所述藍方高炮Blue_HasAA、所述藍方導彈類型Blue_Missile以及紅方無人機與藍方高價值目標之間的距離Distance構建情景集S={S1,S2,...,Sj,...,Sm},m∈N,所述情景集S中第j個情景表示為:
Sj=(Red_ESMState(j),Red_SARState(j),Red_Missile(j),Red_Height(j),Blue_RadarState(j),Blue_ECMState(j),Blue_HasAA(j),Blue_Missile(j),Distance(j)),j∈m;
步驟3:根據所述紅方無人機的決策變量和藍方陣地的決策變量利用影響圖建模方法按如下步驟構建影響圖:
步驟3.1:利用所述紅方無人機的決策變量和藍方陣地的決策變量構建有向無環圖G:
G=(V,E)???????????????(1)
式(1)中,V代表所述有向無環圖中節點的集合,E代表所述有向無環圖中有向邊的集合,并有:
V=VC∪VD∪VU???????????(2)
式(2)中VC代表所述有向無環圖中所有的隨機節點,VD代表所述有向無環圖中所有的決策節點,VU代表所述有向無環圖中所有的效用節點,并有:
VC=(Red_ESMState,Red_SARState,Red_Missile,Red_Height,Blue_RadarState,Blue_ECMState,Blue_HasAA,Blue_Missile,Distance,Red_GetLocation,Blue_GetLocation,Red_Result,Red_Destroyed);
VD=(Red_Action);
VU=(Utility);
所述有向無環圖中有向邊的集合E={(Red_Missile,Red_Action),(Red_Height,Red_Action),(Red_ESMState,Red_Action),(Red_SARState,Red_Action),(Distance,Red_Action),(Blue_ECMState,Red_GetLocation),(Distance,Red_GetLocation),(Red_ESMState,Red_GetLocation),(Red_SARState,Red_GetLocation),(Red_GetLocation,Red_Result),(Distance,Red_Result),(Red_Action,Red_Result),(Red_Height,Red_Result),(Distance,Blue_GetLocation),(Red_SARState,Blue_GetLocation),(Blue_RadarState,Blue_GetLocation),(Red_Height,Red_Destroyed),(Blue_GetLocation,Red_Destroyed),(Blue_Missile,Red_Destroyed),(Distance,Red_Destroyed),(Red_Action,Red_Destroyed),(Blue_HasAA,Red_Destroyed),(Red_Result,Utility),(Red_Destroyed,Utility)};
由所述所有的隨機節點VC、所有的決策節點VD和所有的效用節點VU以及有向邊的集合E構建出所述有向無環圖;
步驟3.2:利用所述紅方無人機的決策變量和藍方陣地的決策變量構建變量集合X;
X=XC∪XD?????????????(3)
式(3)中,XC是隨機變量集合,并有:
XC={Red_ESMState,Red_SARState,Red_Missile,Red_Height,Blue_RadarState,Blue_ECMState,Blue_HasAA,Blue_Missile,Distance,Red_GetLocation,Blue_GetLocation,Red_Result,Red_Destroyed};
根據所述紅方無人機的決策變量和藍方陣地的決策變量獲得所述隨機變量集合XC中每個隨機變量的狀態空間Ω為:
ΩRed_ESMState={開,關},ΩRed_SARState={開,關},ΩRed_Missile={A,B}、ΩRed_Height={中,低},ΩBlue_RadarState={開,關},ΩBlue_ECMState={開,關},ΩBlue_HasAA={是,否},ΩBlue_Missile={中程導彈,近程導彈,無導彈},ΩDistance={遠,中,近},ΩRed_GetLocation={是,否},ΩBlue_GetLocation={是,否},ΩRed_Result={藍方高價值目標完全損毀,藍方高價值目標高度損毀,藍方高價值目標中度損毀,藍方高價值目標未損毀},ΩRed_Destroyed={是,否};
式(3)中,XD是決策變量集合,并有:
XD={Red_Action};
根據所述紅方無人機決策候選行動方案集Red_Action獲得決策變量集合XD中決策變量Red_Action的備選方案集為{D1,D2,……,Dn},n∈N;
步驟3.3:利用所述紅方無人機的決策變量和藍方陣地的決策變量構建隨機變量概率分布的集合;
所述隨機變量概率分布的集合為:
Pr={P(Red_ESMState),P(Red_SARState),P(Red_Missile),P(Red_Height),P(Blue_RadarState),P(Blue_ECMState),P(Blue_HasAA),P(Blue_Missile),P(Red_GetLocationPar(Red_GetLocation)),P(Blue_GetLocationPar(Blue_GetLocation)),P(Red_ResultPar(Red_Result)),P(Red_DestroyedPar(Red_Destroyed)),P(Distance)};
??????????????????????(4)
式(4)中,Par(Red_GetLocation)為所述隨機變量集合XC中隨機變量Red_GetLocation的父節點集合,并有Par(Red_GetLocation)={Red_ESMState,Red_SARState,Blue_ECMState,Distance};
Par(Blue_GetLocation)為所述隨機變量Blue_GetLocation的父節點集合,并有Par(Blue_GetLocation)={Blue_RadarState,Red_SARState,Distance};
Par(Red_Result)為所述隨機變量Red_Result的父節點集合,并有Par(Red_Result)={Red_Height,Red_Action,Distance,Red_GetLocation};
Par(Red_Destoryed)為所述隨機變量Red_Destoryed的父節點集合,并有Par(Red_Destoryed)={Red_Height,Blue_HasAA,Blue_Missile,Distance,Red_Action,Blue_GetLocation};
步驟3.4:利用所述紅方無人機的決策變量構建效用函數的集合;
令所述效用函數的集合為U:
U={U(Red_Result,Red_Destroyed)}?????????????(5)
式(5)中,U(Red_Result,Red_Destroyed)為所述所有的效用節點VU中效用節點Utility的效用函數,并有:
式(6)中,U1、U2、U3、U4、U5、U6、U7和U8分別表示在不同條件下效用節點Utility的效用函數值;
利用所述有向無環圖、變量集合、隨機變量概率分布的集合和效用函數的集合構建出所述影響圖;
步驟4:根據所述影響圖利用式(7)獲得紅方無人機決策候選行動方案集Red_Action中每一種紅方無人機決策候選行動方案在情景集S中的每一個情景下的期望效用值EU(Di,Sj):
EU(Di,Sj)=ΣU(Red_Result,Red_Destroyed)P(Red_Result,Red_Destroyede)????????(7)
式(7)中,e代表證據,Di表示第i種紅方無人機決策候選行動方案,i∈n,Sj表示第j個情景,j∈m;
步驟5:紅方無人機根據所述期望效用值EU(Di,Sj)進行魯棒決策;
步驟5.1:選擇魯棒決策候選行動方案;
令紅方無人機決策候選行動方案集Red_Action中的決策候選行動方案Df,在情景集S中滿足min(EU(Df,Sj))≥α,(f∈n,j∈m,j=1,2,...,m),α為預定的收益閾值,則決策候選行動方案Df為魯棒決策候選行動方案并保留Df;
判斷所有的決策候選行動方案,保留所有的魯棒決策候選行動方案,刪除剩余決策候選行動方案;
步驟5.2:識別最優魯棒行動方案;
利用式(8)獲得所述所有的魯棒決策候選行動方案在每一個情景中的最大期望效用值集EU+:
式(8)中:表示第j種情景下所有的魯棒決策候選行動方案所對應的期望效用值EU(Di,Sj)中的最大期望效用值;
利用式(9)獲得所述魯棒決策候選行動方案在每一個情景中的最小期望效用值集EU-:
式(9)中:表示第j種情景下所有的魯棒決策候選行動方案所對應的期望效用值EU(Di,Sj)中的最小期望效用值;
利用式(10)獲得所有的魯棒決策候選行動方案與所述最大期望效用值集EU+的距離
利用式(11)獲得所有的魯棒決策候選行動方案與所述最小期望效用值集EU-的距離
利用式(12)獲得所有的魯棒決策候選行動方案的貼近度ci:
選擇所述貼近度ci最大的魯棒決策候選行動方案為最優魯棒行動方案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310455107.0/1.html,轉載請聲明來源鉆瓜專利網。





