[發明專利]基于知識嵌入的區域覆蓋和連通保持的集群控制方法有效
| 申請號: | 202011393769.6 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112203291B | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 丘騰海;吳士廣;蒲志強;劉振;易建強;常紅星 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | H04W16/18 | 分類號: | H04W16/18;H04W16/22;G06N3/04;G06N3/08 |
| 代理公司: | 北京市恒有知識產權代理事務所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 知識 嵌入 區域 覆蓋 連通 保持 集群 控制 方法 | ||
1.一種基于知識嵌入的區域覆蓋和連通保持的集群控制方法,其特征在于,該方法包括:
步驟S10,實時獲取集群中各智能體和目標的狀態信息,并通過全連接神經網絡進行特征編碼,獲得智能體特征和目標特征;
步驟S20,計算所述智能體特征和目標特征之間的注意力關注系數, 歸一化并通過觀測多頭注意力機制進行多頭注意力特征提取,獲得智能體與目標之間的觀測注意力特征;
步驟S30,基于所述智能體與目標之間的觀測注意力特征,通過通信多頭注意力機制提取各鄰居智能體的交互信息和查詢目標特征、鍵目標特征和值目標特征映射、、,并通過多跳通信機制擴展智能體的感受野,獲得智能體與目標之間的交互注意力特征;
步驟S40,分別基于代數連通度以及覆蓋率和目標與智能體間的距離設計集群連通保持和集群對目標覆蓋的總的獎懲函數,并結合所述交互注意力特征,計算當前時刻各智能體能夠獲得最大累計回報的動作;
步驟S50,將各智能體通過鏈式拓撲連接,并刪除冗余重要連接邊,獲得目標覆蓋大于設定閾值的通信拓撲圖以及重要性節點集合;
步驟S60,基于分布式連通保持策略、重要性節點集合以及設定的約束條件之間的關系,計算各智能體保持連通的動作的最大步長;
步驟S70,基于所述最大步長進行動作的約束截斷,并通過截斷后的動作進行集群中各智能體控制。
2.根據權利要求1所述的基于知識嵌入的區域覆蓋和連通保持的集群控制方法,其特征在于,步驟S20包括:
步驟S21,計算所述智能體特征和目標特征之間的注意力關系系數,并采用softmax函數進行歸一化,獲得不同目標的歸一化關注系數;
步驟S22,基于所述不同目標的歸一化關注系數、智能體特征,采用觀測多頭注意力機制進行多頭注意力特征提取,獲得智能體與目標之間的觀測注意力特征。
3.根據權利要求2所述的基于知識嵌入的區域覆蓋和連通保持的集群控制方法,其特征在于,所述不同目標的歸一化關注系數,其公式表示為:
其中,為第
4.根據權利要求2所述的基于知識嵌入的區域覆蓋和連通保持的集群控制方法,其特征在于,所述智能體與目標之間的觀測注意力特征,其公式表示為:
其中,表示所述觀測多頭注意力機制的探測頭個數,表示第個探測頭,表示第個探測頭的權重系數矩陣,為最優非線性函數,代表第個探測頭對應的第
5.根據權利要求1所述的基于知識嵌入的區域覆蓋和連通保持的集群控制方法,其特征在于,所述查詢目標特征、鍵目標特征和值目標特征映射、、,其公式表示為:
其中,、和為設定的交互線性權重矩陣。
6.根據權利要求5所述的基于知識嵌入的區域覆蓋和連通保持的集群控制方法,其特征在于,所述各鄰居智能體的交互信息,其公式表示為:
其中,代表拼接操作,為最優非線性函數,
其中,代表鍵目標特征的維數。
7.根據權利要求1所述的基于知識嵌入的區域覆蓋和連通保持的集群控制方法,其特征在于,所述智能體與目標之間的交互注意力特征,其公式表示為:
其中,為設定的權重系數矩陣,代表拼接操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011393769.6/1.html,轉載請聲明來源鉆瓜專利網。





