[發明專利]多智能體協同任務分配方法有效
| 申請號: | 201911226009.3 | 申請日: | 2019-12-04 |
| 公開(公告)號: | CN111311049B | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 趙奕鑫;陸麟鑫;劉丁翔;何青 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06N3/12 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 馬魯晉 |
| 地址: | 210094 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 體協 任務 分配 方法 | ||
1.一種多智能體協同任務分配方法,其特征在于,步驟如下:
步驟1、在考慮智能體航程約束和能力約束的條件下建立任務空間集合模型,然后分別針對突防任務和探測任務進行效能分析;具體步驟為:
步驟1-1、建立任務空間集合模型,包括智能體集合、任務集合、任務約束類型集合;
所述智能體集合為U={U1,U2,...,Un},U為有限集合;
智能體要分配的任務集合為T={T1,T2,...,Tn};
智能體i自身的約束條件為:Ri={Di,Hi},Di表示智能體i的航程約束,Hi表示智能體的能力約束;
任務約束類型集合為:Fi={Ai,Pi,Si},其中,Ai表示第i個任務是打擊任務,Pi表示第i個任務是突防任務,Si表示第i個任務是偵察任務;
步驟1-2、對突防任務進行分析,假設某次突防中共有T個任務載荷與D個誘餌,防御系統對此T+D個目標進行識別,并對其中認為危險的N個目標發射毀傷設備攔截,假設敵方防御系統對任務載荷的識別概率為P,任務載荷數目為T,則最終突破敵方防御的任務載荷數目的期望為:E(T)=T*(1-P),將E(T)視為突防效能評價的指標值;
步驟1-3、對探測任務進行分析,其基準為:
(1)無人機對區域進行探測的過程中,無人機的飛行軌跡應沒有重復;
(2)建立收益函數模型為:
其中,NU是無人機數量,NA是目標區域數量;X(k,i)表示第k個無人機是否對第i個目標進行探測,為1表示有,為0表示無;Si表示第i個目標區域的面積,Prtg表示類型為Tg的傳感器對探測任務為Gg的目標區域的探測收益系數;{T1,T2,…Tn}表示傳感器類型集合,{G1,G2,…Gm}表示探測任務類型集合;
步驟2、分析任務分配的約束條件,即分別分析時間約束條件和類型約束條件;
步驟3、建立任務分配函數模型,即根據上述條件建立智能體協同任務分配目標函數模型;
步驟4、利用遺傳算法確定基于收益最大化的任務分配方法。
2.根據權利要求1所述的多智能體協同任務分配方法,其特征在于,步驟2中分析時間約束條件和類型約束條件具體為:
步驟2-1、時間約束:對于任意給定的任務Ti,智能體Ui如果分配到該任務,則智能體必須在給定的時間窗口[ETime(Ti),LTime(Ti)]到達任務區才可以完成任務,其中ETime(Ti)是智能體到達給定任務區的最早時間,LTime(Ti)是智能體到達給定任務區的最晚時間;
步驟2-2、類型約束,包括智能體自身的類型約束和任務自身的類型;
所述智能體自身的類型約束包括兩種構型:具備執行偵察任務能力的智能體,具備執行突防任務能力的智能體可以拋灑誘餌或者配備了干擾機;
任務自身的類型,智能體類型只有與任務類型相匹配才能執行該任務。
3.根據權利要求1所述的多智能體協同任務分配方法,其特征在于,步驟3中建立智能體協同任務分配目標函數模型為:
max[f1(X)-f2(X)]
式中,f1(X)為智能體完成任務得到的收益;f2(X)為智能體完成任務付出的代價。
4.根據權利要求1所述的多智能體協同任務分配方法,其特征在于,步驟4中利用遺傳算法確定基于收益最大化的任務分配方法,具體步驟為:
步驟4-1、對多智能體協同任務分配進行整數編碼,將整形決策矢量映射成染色體,決策變量映射成基因位,染色體用一維非負數組表示,默認第i個基因位對應第i枚智能體,基因值為智能體被分配的任務序號;編碼時若不滿足約束則編碼無效,進行重新編碼,直到編碼滿足所有的約束規則;
步驟4-2、采用選擇算子計算出群體中每個個體的適應度f(xi)(i=1,2,...,M),M為種群大小;對所有個體進行排序,選擇適應度最高的個體進行復制,取代群體中適應度最低的個體;
步驟4-3、采用交叉算子,選取一個父染色體,隨機選取小于M的兩個不同隨機數,并將兩個隨機數代表的基因位之間的基因倒序排列,從而完成交叉工作;
步驟4-4、采用變異算子,采用隨機選取兩個相鄰基因位互換基因值的方法進行變異操作;
步驟4-5、建立適應度函數,函數為fitness=w1×Gd+w2×Gp,其中Gd代表探測收益,也即分配去執行探測任務的智能體的探測能力系數之和;Gp代表突防收益,也即成功突防子任務載荷數目的期望,w1,w2為系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911226009.3/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





