[發明專利]多智能體多樣性策略的任務執行方法、裝置及智能體在審
| 申請號: | 202211268555.5 | 申請日: | 2022-10-17 |
| 公開(公告)號: | CN115660155A | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 黃瑞欣;王子昂;于超;汪玉;楊華中;張盛 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/0631;G06Q10/083;G06N3/0464 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 雷玉龍 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 多樣性 策略 任務 執行 方法 裝置 | ||
1.一種多智能體多樣性策略的任務執行方法,其特征在于,所述方法應用于任意智能體,其中,所述方法包括以下步驟:
獲取其他所有智能體的分享信息和自身預設區域內的二維信息;
根據所述分享信息和所述二維信息識別自身靠近每個任務目標的第一任務價值,以及移動任務目標距離朝向對應目標點的第二任務價值;
根據所述第一任務價值和所述第二任務價值匹配最優任務目標,根據最優任務目標對應的任務類型執行獨立任務動作或協作任務動作,以移動所述最優任務目標至對應目標點。
2.根據權利要求1所述的方法,其特征在于,在移動當前最優任務目標的過程中,還包括:
若檢測其他最優任務目標時,中斷移動所述當前最優任務目標的同時,移動所述其他最優任務目標至對應目標點。
3.根據權利要求1所述的方法,其特征在于,所述分享信息包括所有智能體的位置信息、任務目標的位置信息及其對應的目標點的位置信息。
4.根據權利要求3所述的方法,其特征在于,所有智能體之間通過傳遞所有智能體的位置信息、任務目標的位置信息及其對應的目標點的位置信息拼接得到向量實現信息分享。
5.根據權利要求1所述的方法,其特征在于,所述任意智能體中具有訓練得到的網絡架構,所述網絡架構包括多層感知機、卷積神經網絡、全連接層和分類器,其中,所述多層感知機用于將所有智能體的位置信息、任務目標的位置信息及其對應的目標點的位置信息拼接成向量,所述卷積神經網絡用于識別所述二維信息的特征,所述全連接層用于將所述向量和所述特征拼接成抽象特征,所述分類器用于根據所述抽象特征輸出離散動作。
6.根據權利要求5所述的方法,其特征在于,在所述網絡架構訓練過程中,還包括:
設置所述網絡架構的步數懲罰參數,利用所述步數懲罰參數訓練智能體完成任務的步數。
7.一種多智能體多樣性策略的任務執行裝置,其特征在于,所述裝置應用于任意智能體,包括:
獲取模塊,用于獲取其他所有智能體的分享信息和自身預設區域內的二維信息;
處理模塊,用于根據所述分享信息和所述二維信息識別自身靠近每個任務目標的第一任務價值,以及移動任務目標距離朝向對應目標點的第二任務價值;
執行模塊,用于根據所述第一任務價值和所述第二任務價值匹配最優任務目標,根據最優任務目標對應的任務類型執行獨立任務動作或協作任務動作,以移動所述最優任務目標至對應目標點。
8.根據權利要求7所述的裝置,其特征在于,所述執行模塊,進一步用于:
在移動當前最優任務目標的過程中,若檢測其他最優任務目標時,中斷移動所述當前最優任務目標的同時,移動所述其他最優任務目標至對應目標點。
9.一種智能體,其特征在于,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述程序,以實現如權利要求1-6任一項所述的多智能體多樣性策略的任務執行方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行,以用于實現如權利要求1-6任一項所述的多智能體多樣性策略的任務執行方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211268555.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





