[發明專利]有向網絡下基于量化通信的完全分布式納什均衡搜索方法在審
| 申請號: | 202111384902.6 | 申請日: | 2021-11-22 |
| 公開(公告)號: | CN114118422A | 公開(公告)日: | 2022-03-01 |
| 發明(設計)人: | 饒心培;許文盈 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06N5/04 | 分類號: | G06N5/04 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 向文 |
| 地址: | 211100 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 基于 量化 通信 完全 分布式 均衡 搜索 方法 | ||
1.一種有向網絡下基于量化通信的完全分布式納什均衡搜索方法,其特征在于,包括如下步驟:
S1:根據通訊網絡結構,獲取加權鄰接矩陣W;
S2:根據決策可行集,每個玩家選擇初始決策,并對其他所有玩家決策進行估計;
S3:每步迭代前,根據提出的量化方案,每個玩家通過通訊網絡傳輸其決策估計上一步的更新信息給鄰居,同時處理鄰居傳來的信息,更新對鄰居決策估計的估計;
S4:每步迭代,根據設定的加權鄰接矩陣W,每個玩家計算出所有玩家決策估計的加權平均,并據此更新其決策估計;
S5:當所有玩家決策估計更新量為零,即算法收斂,獲取到NE。
2.根據權利要求1所述的一種有向網絡下基于量化通信的完全分布式納什均衡搜索方法,其特征在于,所述步驟S1中加權鄰接矩陣W的獲取方式具體為:
A1:對于有向網絡,如果網絡中節點i可以接收到節點j傳來的信息,則設置Aij=1,j∈Ni,其中,Ni表示節點i的入鄰居,如果不能接收到,則設置按照這種方式,得到通訊網絡的鄰接矩陣A=[Aij];
A2:已知其鄰接矩陣A,若Aij=1,則設置wij>0,若Aij=0,則設置wij=0,選取分布式迭代策略計算權重分配,得到帶有自環的雙隨機加權鄰接矩陣W=[wij],即滿足以下性質:
wii>0,對于通訊網絡中所有的節點i; (I)
3.根據權利要求1所述的一種有向網絡下基于量化通信的完全分布式納什均衡搜索方法,其特征在于,所述步驟S2具體為:
對于參與博弈的每一位玩家,根據其決策可行集選擇初始時刻的決策,即滿足:
其中,表示參與博弈的玩家的集合,xi,i和xi,-i分別表示玩家i的決策和對其他人決策的估計,Ωi表示玩家i的決策可行集。
4.根據權利要求1所述的一種有向網絡下基于量化通信的完全分布式納什均衡搜索方法,其特征在于,所述步驟S3具體為:
B1:定義一個標準的量化水平數目為2K+1的一致量化器,具體定義如下:
其中,
當時,q[γi]=-q[-γi] (VI)
根據上述定義,可以得到,當時,量化誤差為:
并稱此時量化器非飽和;
B2:基于上述一致量化器,提出一種編碼解碼的量化方案:
對于任意代理i和其鄰居j,i通過編碼器Fi→j將信息量化傳給鄰居j,j通過解碼器處理收到的量化信息,編碼器和解碼器定義分別如下:
Fi→j:
其中,s(k)為引入的全局比例函數,滿足當k→∞時,s(k)→0;表示j對i的決策估計xi的估計;
B3:根據上述定義,ξi(k)和有相同的更新方式和初值,由此可得:
5.根據權利要求1所述的一種有向網絡下基于量化通信的完全分布式納什均衡搜索方法,其特征在于,所述步驟S4具體為:
C1:根據設定的加權鄰接矩陣W,每個玩家計算出所有玩家決策估計的加權平均,即對于
C2:根據計算出的所有玩家決策估計的加權平均,每個玩家通過投影梯度法更新自己的決策,并以加權平均中的對其他玩家決策的估計作為更新后的決策估計,即:
其中,α表示步長,Ji(x)表示玩家i的成本函數,它是所有玩家決策x的函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111384902.6/1.html,轉載請聲明來源鉆瓜專利網。





