[發(fā)明專利]組內(nèi)決策一致多群組博弈的納什均衡指定時(shí)間搜索方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210056868.8 | 申請(qǐng)日: | 2022-01-18 |
| 公開(公告)號(hào): | CN114488802A | 公開(公告)日: | 2022-05-13 |
| 發(fā)明(設(shè)計(jì))人: | 周佳玲;欒萌;呂躍祖;溫廣輝 | 申請(qǐng)(專利權(quán))人: | 周佳玲;呂躍祖;溫廣輝 |
| 主分類號(hào): | G05B13/04 | 分類號(hào): | G05B13/04 |
| 代理公司: | 南京眾聯(lián)專利代理有限公司 32206 | 代理人: | 張?zhí)煺?/td> |
| 地址: | 210094 江蘇省南京市*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 決策 一致 多群組 博弈 均衡 指定 時(shí)間 搜索 方法 | ||
1.一種組內(nèi)決策一致多群組博弈的納什均衡指定時(shí)間搜索方法,其特征在于,包括如下步驟:
步驟1:針對(duì)多無(wú)人集群系統(tǒng)在集群內(nèi)部協(xié)同合作、各集群之間競(jìng)爭(zhēng)博弈的情形,為多智能體系統(tǒng)構(gòu)建服從一致性約束集的多集群博弈模型;
步驟2:針對(duì)多智能體系統(tǒng)構(gòu)建通信拓?fù)浣Y(jié)構(gòu);
步驟3:結(jié)合時(shí)間規(guī)劃方法,為每個(gè)智能體設(shè)計(jì)指定時(shí)間收斂的多任務(wù)集群博弈均衡快速準(zhǔn)確搜索方法;
步驟4:給出納什均衡搜索方法實(shí)現(xiàn)指定時(shí)間收斂的參數(shù)條件。
2.根據(jù)權(quán)利要求1所述的組內(nèi)決策一致多群組博弈的納什均衡指定時(shí)間搜索方法,其特征在于,所述步驟1具體包括如下子步驟:
步驟1-1:針對(duì)多無(wú)人集群系統(tǒng)在集群內(nèi)部協(xié)同合作、各集群之間競(jìng)爭(zhēng)博弈的情形,構(gòu)建如下的服從一致性約束集的多集群博弈模型:
其中,N為參與博弈的集群個(gè)數(shù),集群i包含ni個(gè)智能體,為集群i的狀態(tài),編號(hào)ij表示集群i中的第j個(gè)智能體,為智能體ij的狀態(tài),表示所有集群的聯(lián)合狀態(tài),集群的狀態(tài)服從的一致性約束集為二次連續(xù)可微凸函數(shù)fij(x)表示集群i中智能體j的代價(jià)函數(shù),函數(shù)fij(x)具有Lipschitz連續(xù)梯度:即對(duì)于任意滿足其中l(wèi)ij>0為L(zhǎng)ipschitz常數(shù),函數(shù)fi(x)為集群i的代價(jià)函數(shù):
3.根據(jù)權(quán)利要求1所述的組內(nèi)決策一致多群組博弈的納什均衡指定時(shí)間搜索方法,其特征在于,所述步驟2具體包括如下子步驟:
步驟2-1:多智能體系統(tǒng)的通信拓?fù)浣Y(jié)構(gòu)描述如下:
將所有智能體間的通信拓?fù)浣橛邢驁D節(jié)點(diǎn)集為邊集合為N為參與博弈的集群個(gè)數(shù),集群內(nèi)部和不同集群間可在拓?fù)溥B邊上進(jìn)行有向通信,具體地,集群i包含ni個(gè)智能體,智能體集合表示為集群i內(nèi)部的通信拓?fù)溆谜T導(dǎo)子圖表示,編號(hào)ij表示集群i中的第j個(gè)智能體,對(duì)于智能體定義其在網(wǎng)絡(luò)中的入鄰居集為定義其集群內(nèi)的入鄰居集合為其集群內(nèi)的出鄰居集合定義圖的鄰接矩陣為其中為矩陣A的第行列的元素,如果(pq,ij)∈ε,pq≠ij,則否則定義圖的鄰接矩陣為其中為矩陣Ai的第j行l(wèi)列的元素,如果(il,ij)∈εi,j≠l,則否則顯然,A1,...,AN為矩陣A的對(duì)角塊,定義為圖的拉普拉斯矩陣,其中為矩陣L的第行列的元素,如果ij=pq,則否則
步驟2-2:多智能體系統(tǒng)的通信拓?fù)浣Y(jié)構(gòu)要求如下:
通信圖和通信子圖其中,i=1,2,...,N,均是強(qiáng)連通的。
4.根據(jù)權(quán)利要求1所述的組內(nèi)決策一致多群組博弈的納什均衡指定時(shí)間搜索方法,其特征在于,所述步驟3具體包括如下子步驟:
步驟3-1:結(jié)合時(shí)間規(guī)劃的方法,基于領(lǐng)導(dǎo)-跟隨一致性思想為智能體估計(jì)全局的狀態(tài)信息:
其中,表示智能體ij對(duì)全局狀態(tài)x的估計(jì),正常數(shù)滿足dij表示智能體ij的入度:是采樣間隔,采樣間隔時(shí)間序列被設(shè)計(jì)為
是一個(gè)收斂的無(wú)窮級(jí)數(shù)序列,即是有限的;
定義
步驟3-2:智能體的狀態(tài)迭代律和用于梯度信息估計(jì)的輔助變量更新律設(shè)計(jì)為如下形式:
其中,xij(t)表示智能體ij在時(shí)刻t的狀態(tài),為梯度信息估計(jì)項(xiàng),初始化為α是待設(shè)計(jì)正的常量,矩陣為行隨機(jī)的,為在第j行m列的元素,令矩陣為列隨機(jī)的,為在第j行m列的元素,每個(gè)智能體ij選擇兩組正參數(shù)集合和滿足以下條件:
其中這兩組參數(shù)分別作為ij從集群內(nèi)的內(nèi)鄰居接收的信息和發(fā)送給集群內(nèi)的外鄰居信息的權(quán)重,定義為矩陣Ri對(duì)應(yīng)于特征值1的左特征向量,即滿足vi定義為矩陣Ci對(duì)應(yīng)于特征值1的右特征向量,即滿足一種較為簡(jiǎn)單的選取方式為:
定義易得均是Schur矩陣。
5.根據(jù)權(quán)利要求1所述的組內(nèi)決策一致多群組博弈的納什均衡指定時(shí)間搜索方法,其特征在于,所述步驟4具體包括如下子步驟:
步驟4-1:要求偽梯度是強(qiáng)單調(diào)的,即存在常數(shù)l>0使得
其中可視為集群i的目標(biāo)函數(shù),y=[y1,y2,...yN]T為N個(gè)虛擬參與者的狀態(tài);
步驟4-2:設(shè)計(jì)的組內(nèi)決策一致性約束下多群組博弈的納什均衡搜索方法實(shí)現(xiàn)指定時(shí)間收斂步長(zhǎng)參數(shù)要求如下:
其中,
σ=maxi{b1i}+γ2maxi{b2i}+γ3maxi{b3i},
Wci為對(duì)稱正定矩陣且滿足為對(duì)稱正定矩陣且滿足為對(duì)稱正定矩陣且滿足為圖的拉普拉斯矩陣。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于周佳玲;呂躍祖;溫廣輝,未經(jīng)周佳玲;呂躍祖;溫廣輝許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210056868.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 決策協(xié)調(diào)方法、執(zhí)行裝置和決策協(xié)調(diào)器
- 一種基于循環(huán)更新模式的決策樹構(gòu)建方法
- 一種基于群決策的建筑項(xiàng)目決策系統(tǒng)及決策方法
- 一種基于反射弧的智慧大腦決策系統(tǒng)及決策方法
- 一種三維消防指揮決策輔助系統(tǒng)
- 一種決策方法、系統(tǒng)以及電子設(shè)備
- 基于決策引擎和模型平臺(tái)的業(yè)務(wù)決策邏輯更新方法
- 一種雙層優(yōu)先級(jí)決策系統(tǒng)
- 一種應(yīng)用程序的業(yè)務(wù)執(zhí)行方法、裝置及電子設(shè)備
- 基于區(qū)塊鏈的決策方法及裝置和電子設(shè)備
- 一種群組通信方法和服務(wù)器
- 基于LTE多媒體廣播多播業(yè)務(wù)的群組通信方法及用戶設(shè)備
- 基于LTE增強(qiáng)型多媒體廣播多播業(yè)務(wù)的群組通信的無(wú)線資源高效傳輸?shù)姆椒坝脩粼O(shè)備
- 一種群組多播和群組創(chuàng)建的方法以及移動(dòng)網(wǎng)絡(luò)平臺(tái)
- 去中心化的即時(shí)通訊群組信息存儲(chǔ)方法和系統(tǒng)
- 多群組鏡頭和攝像模組及其電子設(shè)備
- 多群組鏡頭和攝像模組及其電子設(shè)備
- 基于LTE多媒體廣播多播業(yè)務(wù)的群組通信方法及用戶設(shè)備
- 罕見病研究群組管理方法、存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品
- 多主體賬戶關(guān)聯(lián)的管理方法和服務(wù)平臺(tái)
- 博弈數(shù)據(jù)分析方法及裝置
- 一種在即時(shí)通訊工具中實(shí)現(xiàn)博弈活動(dòng)的方法
- 面向多智能體同步博弈的建模方法及動(dòng)作預(yù)測(cè)系統(tǒng)
- 一種多主體博弈的增量配電網(wǎng)源網(wǎng)荷協(xié)同規(guī)劃方法
- 一種基于三方演化博弈的配電網(wǎng)決策方法、裝置和設(shè)備
- 對(duì)抗環(huán)境下多無(wú)人機(jī)協(xié)同目標(biāo)分配方法及系統(tǒng)
- 目標(biāo)均衡博弈的處理方法和裝置
- 一種業(yè)務(wù)執(zhí)行方法、裝置及其相關(guān)設(shè)備
- 用于云原生應(yīng)用資源調(diào)度的博弈優(yōu)化方法及其系統(tǒng)
- 一種機(jī)器博弈輔助決策方法及系統(tǒng)





