[發明專利]多智能體系統編隊構型的協同優化方法及裝置在審
| 申請號: | 202011293262.3 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112348157A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 王曉初;周慶瑞;孫昌浩;馮宇婷;邱華鑫 | 申請(專利權)人: | 中國空間技術研究院 |
| 主分類號: | G06N3/00 | 分類號: | G06N3/00 |
| 代理公司: | 北京善任知識產權代理有限公司 11650 | 代理人: | 張振偉 |
| 地址: | 100094 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 體系 統編 構型 協同 優化 方法 裝置 | ||
1.一種多智能體系統編隊構型的協同優化方法,其特征在于,所述方法包括:
為每個智能體建立表示待優化位置的位置變量xi,建立對準變量θi,建立增益變量γi,其中,xi為維度為k的列向量,代表第i個智能體在k維空間的坐標,i為智能體的編號,k為正整數,θi為非負實數,γi為正實數;在t=0時刻,每個智能體初始化xi=Pi,θi=0,γi=1,其中Pi為第i個智能體當前的實際位置,同樣是維度為k的列向量;
為每個智能體開啟迭代過程,在每次迭代中,至少執行下述處理中的至少之一:計算本地效能梯度和約束梯度、進行鄰居間的交互協調、進行位置變量更新、進行對準變量更新、進行增益變量更新;
判斷迭代是否完成:確定每個智能體計算已經迭代的次數πi,當次數πi大于或大于等于給定的最大迭代次數πmax時,迭代完成,否則重復迭代過程,其中,πi和πmax均為正整數;
迭代完成后,將每個智能體將最終的位置變量xi作為構型優化的位置信息;
將智能體按構型優化的位置信息進行排布。
2.根據權利要求1所述的方法,其特征在于,所述計算本地效能梯度和約束梯度,包括:
計算智能體i本地效能函數ui(xi)在當前位置變量xi處的梯度值計算位置變量所允許取值空間的包絡曲面函數Ωi(xi)在當前位置變量xi處的梯度值其中,本地效能函數ui(xi)是以向量xi為變量的標量值型凸函數,包絡曲面函數Ωi(xi)是以向量xi為變量的標量值型凸函數,且任意位置變量所被允許的取值滿足約束關系Ωi(xi)≤0;由此計算得到的為本地效能梯度,為約束梯度。
3.根據權利要求2所述的方法,其特征在于,所述進行鄰居間的交互協調,包括:
使每個智能體i向鄰居智能體廣播位置變量xi、對準變量θi、增益變量γi、本地效能梯度約束梯度并接收所有鄰居發送的相關變量信息,其中,鄰居智能體是指能夠與當前智能體發生通信交流和信息交互的網絡拓撲鄰近的智能體。
4.根據權利要求3所述的方法,其特征在于,所述進行位置變量更新,包括:
將每個智能體按下式(1)計算更新的變化率然后按式(2)進行更新位置變量xi:
其中,代表第i個智能體所有的鄰居智能體組成的集合,mi為實數,代表第i個智能體的質量,△T取值為正實數,代表更新時間步長。
5.根據權利要求4所述的方法,其特征在于,所述進行對準變量更新,包括:
使每個智能體i根據更新后的位置變量xi,對每一個鄰居智能體按照下式(3)計算最優的并按照式(4)計算更新的對準變量θi:
其中,Ik為階數為k的單位矩陣,代表矩陣的克羅內克積運算,為正整數代表集合內元素的數量,abs()代表絕對值運算,對于每一個鄰居和均為實數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國空間技術研究院,未經中國空間技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011293262.3/1.html,轉載請聲明來源鉆瓜專利網。





