[發(fā)明專利]基于群體熵和Q學習的無人機任務(wù)分配方法有效
| 申請?zhí)枺?/td> | 202010614975.9 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111680934B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 方敏;陳燁;羅杰豪;荊銳;楊昊;侯志杰;丁獻碩 | 申請(專利權(quán))人: | 西安電子科技大學 |
| 主分類號: | G06Q10/0631 | 分類號: | G06Q10/0631 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 群體 學習 無人機 任務(wù) 分配 方法 | ||
1.一種基于群體熵和Q學習的無人機任務(wù)分配方法,其特征在于,包括以下步驟:
(1)初始化參數(shù):
初始化大小為X×Y×Z的空間區(qū)域內(nèi)的待執(zhí)行任務(wù)集合為Ta={ta1,ta2,...,tai,...tam},無人機集合為A={a1,a2,...,aj,...,an},第j個無人機aj的狀態(tài)Cj={c1,j,c2,j,...,ci,j,...cm,j},其中,tai表示第i個任務(wù),m表示任務(wù)的總數(shù),m≥2,n表示無人機的總數(shù),n≥1,ci,j表示aj對第i個任務(wù)的狀態(tài),ci,j=0表示不執(zhí)行,ci,j=1表示執(zhí)行;
(2)確定每個無人機aj的鄰居:
通過A中各無人機的在空間區(qū)域內(nèi)的位置坐標,計算每個無人機aj與其他n-1個無人機aw的距離dsj,w,并將aw中dsj,w小于預(yù)設(shè)的通信距離L的無人機作為aj的鄰居,得到aj的鄰居無人機集合則A的鄰居無人機集合為
NEI={Ne1,Ne2,...,Nej,...,Nen},
其中,表示aj的第h個鄰居,j_num為aj的鄰居數(shù)量;
(3)確定敏感無人機和非敏感無人機:
(3a)計算A中每個無人機aj與Ta中每個待執(zhí)行任務(wù)tai之間的距離di,j,得到距離集合DD={D1,D2,...,Dj,...,Dn},其中Dj表示無人機aj與Ta中每個待執(zhí)行任務(wù)之間的距離集合,Dj={d1,j,d2,j,...,di,j,...,dm,j};
(3b)將A中Dj小于預(yù)設(shè)通信距離L的n*個無人機組成敏感無人機集合將其余n-n*個無人機組成非敏感無人機集合其中,aby表示第y個敏感無人機,acx表示第x個非敏感無人機,n**表示非敏感無人機的數(shù)量,n**=n-n*;
(4)每個敏感無人機aby選擇任務(wù)并執(zhí)行:
每個敏感無人機aby選擇與Ta中每個待執(zhí)行任務(wù)之間的距離集合Dby中數(shù)值最小的任務(wù)作為當前任務(wù)并執(zhí)行;
(5)初始化細胞自動機自演化算法參數(shù):
初始化執(zhí)行次數(shù)t,最大執(zhí)行次數(shù)為T,T≥5,最優(yōu)群體熵EB,第t次執(zhí)行中acx對所有任務(wù)的狀態(tài)集Cx(t)={c1,x(t),c2,x(t),...,ci,x(t),...cm,x(t)},其中ci,x(t)表示第t次執(zhí)行中acx對tai的狀態(tài),并令t=1,ci,x(t)=0,EB=1000;
(6)獲取離散信息熵表LS:
(6a)計算無人機集合A的群體熵值group_entropy:
group_entropy=E12(x)+E22(x)+...+Ej2(x)+...+En2(x)
其中Ej(x)表示aj的離散信息熵,p(xij)表示aj執(zhí)行tai的概率;
(6b)判斷EB≥group_entropy是否成立,若是,令EB=group_entropy,并用離散信息熵表LS記錄p(xij),否則EB不變;
(6c)判斷t=T是否成立,若是,得到離散信息熵表LS,否則,令t=t+1,并計算acx對tai的狀態(tài)ci,x(t),然后執(zhí)行步驟(6a),其中ci,x(t)的計算公式為:
where
其中,λ1=1表示acx的鄰居中存在執(zhí)行tai的敏感無人機,λ1=0表示acx的鄰居中不存在執(zhí)行tai的敏感無人機,λ2=1表示acx的鄰居中執(zhí)行tai的無人機數(shù)量大于門限值Num,λ2=0表示acx的鄰居中執(zhí)行tai的無人機數(shù)量小于等于門限值Num;
(7)利用離散信息熵表LS初始化每個無人機aj的AQj表:
初始化大小為(m+1)×(m)的AQj表,并給AQj表中每個元素賦值:
其中,b和c分別表示AQj表中第b行第c列,p(xcj)為離散信息熵表LS記錄的值;
(8)獲取無人機任務(wù)分配結(jié)果:
(8a)初始化迭代次數(shù)為k,最大迭代次數(shù)為K,K≥100,Q學習的學習率為αk,探索判別值為εk,折扣率為γk,閾值常數(shù)為ε0,收益最大值為RE,并令k=1,aj執(zhí)行一次任務(wù)的執(zhí)行量為無人機aj執(zhí)行Ta中各任務(wù)的累計執(zhí)行量集合Ej={E1,j,E2,j,...,Ei,j,...,Em,j},Ta中各任務(wù)需要的執(zhí)行量集合E={e1,e2,...,ei,...,em},其中1>α>0,1>ε>0,1>γ>0,1>ε0>0,RE≥100,Ei,j表示aj對tai的累計執(zhí)行量,Ei,j=0,ei表示tai需要的執(zhí)行量,ei>0;
(8b)計算aj對每個任務(wù)tas的轉(zhuǎn)移概率得到aj對Ta的轉(zhuǎn)移概率子集合則A的轉(zhuǎn)移概率集合為其中:
其中δ,β,M為預(yù)設(shè)的調(diào)節(jié)因子;
(8c)將隨機產(chǎn)生n個0到1之間的小數(shù)組成的小數(shù)集合作為A中每個aj的探索值,并判斷是否成立,若是,執(zhí)行步驟(8d),否則,執(zhí)行步驟(8e);
(8d)aj依據(jù)執(zhí)行Ta中任務(wù)的概率隨機選擇Ta中的tas執(zhí)行,得到更新后的aj的累計執(zhí)行量Es,j,并執(zhí)行步驟(8f),其中Es,j更新公式為:
τ為預(yù)設(shè)常數(shù),1>τ>0;
(8e)aj依據(jù)累計執(zhí)行量集合Ej和AQj表選擇Ta中第π(r)個任務(wù)執(zhí)行,得到更新后的aj的累計執(zhí)行量Eπ(r),j,并執(zhí)行步驟(8f),其中π(r)的計算和Eπ(r),j的更新公式分別為:
(8f)計算由無人機aj從執(zhí)行任務(wù)tar轉(zhuǎn)到執(zhí)行當前任務(wù)taz引起的回報值Rj(r,z):
(8g)aj利用AQj表的更新公式,并通過回報值Rj(r,s)對AQj表進行更新,得到更新后的AQj表;
(8h)判斷k=K是否成立,若是,得到無人機任務(wù)分配結(jié)果:RE={Re1,Re2,...Rei,...Rem},否則,令k=k+1,對學習率αk、折扣率γk、探索判別值εk進行更新,然后執(zhí)行步驟(8b),其中Rei表示執(zhí)行第i個任務(wù)的無人機集合,p為執(zhí)行第i個任務(wù)的無人機總數(shù),αk和γk的更新公式分別為:
η、λ為預(yù)設(shè)的調(diào)節(jié)因子。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學,未經(jīng)西安電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010614975.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





