日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于動態協作圖的多智能體強化學習方法在審

專利信息
申請號: 202011298827.7 申請日: 2020-11-19
公開(公告)號: CN112396187A 公開(公告)日: 2021-02-23
發明(設計)人: 付悅;郝建業;王立 申請(專利權)人: 天津大學
主分類號: G06N20/00 分類號: G06N20/00
代理公司: 天津市北洋有限責任專利代理事務所 12201 代理人: 李素蘭
地址: 300072*** 國省代碼: 天津;12
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 動態 協作 智能 強化 學習方法
【說明書】:

發明公開了一種基于動態協作圖的多智能體強化學習方法,首先,結合注意力機制對多智能體協作圖進行動態構建;其次,基于當前狀態下構造的協作圖,結合啟發式規則進行顯式分組;再其次,對于智能體小組內部的智能體采用max?plus算法進行組內全局最優策略搜索;最后,采用超網絡結合全局狀態信息估計各組局部聯合動作價值,進行信度分配。與現有技術相比,本發明針對多智能體系統提出的算法,在降低計算量的前提下,有效的提高了智能體之間的合作。

技術領域

本發明涉及多智能體強化學習領域領域,特別是涉及一種多智能體強化學習方法。

背景技術

基于協作圖的強化學習中的稀疏協作Q學習(sparse cooperative Q-learning)技術,將所有智能體的信息和相關關系表征在圖表中,但是很難擴展到更大位的狀態和動作空間動作值網絡的表征能力(The Representational Capacity of Action-ValueNetworks)。使用神經網絡近似不同尺寸大小的內在關系,但是僅僅在一次性決策博弈上進行了驗證深度協作圖(deep coordination graph)。基于Q學習端對端訓練的值函數,結合max-plus算法將協作圖擴展到深度學習下的連續決策任務下,但是由于該方法使用了完全連接協作圖的原因,算法的可擴展性收到了一定的限制。多智能體強化學習系統中,常見的做法就是假設所有智能體之間都存在著隱式合作關系,利用智能體獨立的動作值函數與兩兩智能體之間的局部聯合動作值函數之和作為全局聯合動作值函數進行策略估計。

基于值函數分解的強化學習中的值分解網絡(Value Decomposition Network)采用單獨動作值函數求和的方式計算聯合動作值函數,訓練過程中利用聯合動作值函數對神經網絡進行更新,執行時則基于單獨動作值函數選擇最優動作與環境交互。然而由于該方法假設聯合動作值函數和單獨動作值函數存在可加性假設,過于嚴格的限制以及對全局狀態的忽略導致在某些較為復雜的任務上無法達到期望的效果。

QMIX算法針對值分解網絡(VDN)的問題提出解決方案。為更準確的預測聯合動作值函數,QMIX在集中式訓練解決引入全局狀態s進行訓練,利用超網絡將全局狀態s映射到多維正值向量上,作為單獨動作值函數的權重和偏置。基于這種方式對單獨動作值函數進行加權求和,在放松可加性約束的同時利用全局信息提高值函數預測準確性。在一些值分解網絡無法有效學習的環境上有較好的實驗效果。

Qtran算法的提出是為了解決基于可加性約束的值分解網絡和基于單調性約束的QMIX對于不滿足其約束性的可分解任務無法做到有效的聯合動作值函數分解的此類問題,但該方法計算量過大,且較為寬松的約束使得其在多數任務上無法獲得較好的表現。

現有算法將多智能體系統類比為協作圖。具體的,將智能體類比為協作圖中的節點,智能體之間的合作關系類比為協作圖的邊。這些方法往往將協作圖設計為完全連接的圖結構,通過將聯合動作狀態值函數分解為智能體獨立的動作值函數與兩兩智能體之間的局部聯合動作值函數的方式,更準確的預測獨立動作價值和聯合動作價值,從而提高智能體之間的合作能力;另一方面,隱式的信度分配機制也能有效的避免智能體選擇損害合作行為的動作。但是智能體之間的關系往往是動態變化的,某些時刻合作關系并不存在于任意兩個智能體之間。顯然,更為準確的協作圖的構建會帶來更準確的值函數的表達,進而學習到更接近最優策略的聯合動作決策。

發明內容

本發明旨在解決多智能體系統下智能體之間的合作效率問題,而提出了一種基于動態協作圖的多智能體強化學習方法,結合注意力機制提取智能體之間的動態合作關系,進一步結合max-plus算法和超網絡進行智能體策略提升,有效促進了智能體之間的合作。

1.本發明的一種基于動態協作圖的多智能體強化學習方法,其特征在于,該方法具體包括以下步驟:

步驟1、基于多智能體系統構建動態協作圖:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011298827.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 高清国产一区二区三区 | 欧美日韩国产综合另类| 99久久精品免费看国产交换| 国产不卡网站| 999久久久国产| 黄色91在线观看| 久久99精品久久久大学生| 国产麻豆91欧美一区二区| 国产91久| 在线视频国产一区二区| 国产女人与拘做受免费视频| 香港三日三级少妇三级99| 午夜生活理论片| 久久国产欧美视频| 亚洲制服丝袜在线| 国产理论一区二区三区| 乱淫免费视频| 99国产精品免费观看视频re| 香港三日本8a三级少妇三级99| free性欧美hd另类丰满| 国产有码aaaae毛片视频| 免费**毛片| 日韩午夜毛片| 久久精品入口九色| 99久久国产综合精品色伊| av素人在线| 91偷自产一区二区三区精品| 高清欧美精品xxxxx| 亚洲一区2区三区| 欧美日韩国产一二| 免费在线观看国产精品| 日韩一级免费视频| 欧美一区二区三区在线免费观看 | 国产一级一区二区| 亚洲乱码av一区二区三区中文在线: | 国产88在线观看入口| 99久久精品免费视频| 国产91色综合| 国产二区精品视频| 国产精品乱码久久久久久久久| 国产99久久久精品视频| xxxxhd欧美| 又色又爽又大免费区欧美| 久久一级精品视频| 大伊人av| 日韩精品免费一区二区中文字幕 | 国产精品色婷婷99久久精品| 国产精品乱码久久久久久久久| 亚洲少妇中文字幕| 淫片免费看| 91看片免费| 99精品黄色| 911久久香蕉国产线看观看| 欧美一区二区三区片| 国产精品1区二区| 国产99视频精品免费视频7| 国产一级片网站| 日本高清一二三区| 亚洲精品国产精品国产| 午夜裸体性播放免费观看| 黄毛片免费| 国产一区二区视频播放| 久久久久国产精品嫩草影院| 97午夜视频| 91精品啪在线观看国产手机 | 久久综合伊人77777麻豆| 国产一区二区在线91| 思思久久96热在精品国产| 国产盗摄91精品一区二区三区| 精品久久香蕉国产线看观看gif| 欧美精品九九| 日韩精品免费一区| 91一区在线| 亚洲欧美日韩视频一区| 日韩欧美国产高清91| 日韩无遮挡免费视频| 国产一区二区三区黄| 欧美高清极品videossex| 日韩中文字幕久久久97都市激情| 国产精品视频一区二区三| 国产精品久久久av久久久| 国产一级片大全| 国产欧美一区二区三区免费视频| 日本道欧美一区二区aaaa| 精品国产91久久久| 日韩一区免费| 日韩精品福利片午夜免费观看| 91看片app| 狠狠色丁香久久婷婷综合丁香| 偷拍久久精品视频| 欧美激情精品久久久久久免费 | 国产精品国外精品| 欧美日韩国产123| 国产区91| 制服.丝袜.亚洲.另类.中文| 精品国产乱码久久久久久软件影片| 91偷拍网站| 精品国产二区三区| 国产一区日韩一区| 亚洲日韩欧美综合| 国产二区免费视频| 欧美日韩一区免费| 欧美精品xxxxx| 日韩精品一区二区av| 一本一道久久a久久精品综合蜜臀| 免费看农村bbwbbw高潮| 亚洲国产视频一区二区三区| 免费看欧美中韩毛片影院| 香蕉视频在线观看一区二区| 99爱国产精品| 狠狠插狠狠干| 免费看欧美中韩毛片影院| 精品久久综合1区2区3区激情| 国产精品国产一区二区三区四区| 日韩欧美国产精品一区| 亚洲国产精品一区二区久久hs | 国产精品九九九九九九九| 久久午夜鲁丝片午夜精品| 亚洲欧美日韩三区| 国产韩国精品一区二区三区| aaaaa国产欧美一区二区| 国产天堂一区二区三区| 国产精品亚洲欧美日韩一区在线| 91影视一区二区三区| 日韩午夜电影在线| 国产69精品久久99不卡解锁版 | 亚洲精品久久久久久久久久久久久久 | 免费精品99久久国产综合精品应用| 国产三级欧美三级日产三级99| 爽妇色啪网| 国产精品一级在线| 国产精欧美一区二区三区久久久| 久久国产精品欧美| 中文字幕一级二级三级 | 久久一二区| 亚洲精品老司机| 少妇高潮一区二区三区99小说| 91av一区二区三区| 亚洲va国产| 99国精视频一区一区一三| 亚洲欧洲另类精品久久综合| 狠狠色噜噜综合社区| 日韩av在线播放网址| 国产精品久久免费视频| 99精品少妇| 国产电影精品一区| 99爱国产精品| 中文字幕欧美另类精品亚洲| 国产伦精品一区二区三区照片91| 午夜av电影网| 国产午夜精品一区二区三区最新电影| 欧美日韩国产一区二区三区在线观看| 精品少妇一区二区三区免费观看焕 | 私人影院av| 99久久婷婷国产精品综合| 免费**毛片| 91偷拍网站| 亚洲国产精品第一区二区| 中文字幕天天躁日日躁狠狠躁免费 | 国产91高清| 精品国产仑片一区二区三区| 国产一区第一页| 97欧美精品| 久久精品国产久精国产| 国产精品乱码久久久久久久| 精品国产精品亚洲一本大道| 日本免费电影一区二区| 国产精品一区在线观看| a级片一区| 特级免费黄色片| 国产欧美一区二区精品性色超碰| 国产伦精品一区二区三区免费优势 | 久久夜色精品久久噜噜亚| 午夜毛片电影| 欧美一区二区三区久久综合| 亚洲精品久久久久中文第一暮| 国产精品欧美久久| 国产精品免费不卡| 欧美日韩精品在线一区| 国产精品免费一区二区区| 亚洲精品性| 中文在线√天堂| 亚洲精华国产欧美| 99国产精品9| 久久精品国产综合| 99久久夜色精品| 国产一区二区三区久久久| 久久两性视频| 天天射欧美| 99久久国产免费,99久久国产免费大片 | 国内久久久| 精品国产一区二区三区免费| 蜜臀久久精品久久久用户群体| 欧美网站一区二区三区| 少妇厨房与子伦在线观看| 国产精品人人爽人人做av片| 国产一区二区三区精品在线| av素人在线| 亚洲精品人| 亚洲美女在线一区| 国产亚洲另类久久久精品| 91在线一区二区| 久久99精品国产麻豆婷婷洗澡| 亚洲视频精品一区| 欧美一区二区三区在线视频观看| 福利片91| 国产黄色一区二区三区| 久久国产精品久久| 高清国产一区二区| 69xx国产| 欧洲在线一区| 亚洲一区中文字幕| av午夜在线观看| 欧美日韩国产一二三| 国产一区欧美一区| 性欧美激情日韩精品七区| 精品国产乱码久久久久久久久| 精品三级一区二区| 国语对白老女人一级hd| 99国产精品九九视频免费看| 一区二区不卡在线| 国产麻豆精品久久| 99热一区二区| 午夜影院你懂的| 久久精品一| 国产精品久久免费视频| 欧美在线视频三区| 精品国产乱码久久久久久久久 | 在线精品视频一区| 黑人巨大精品欧美黑寡妇| 午夜亚洲国产理论片一二三四| 999亚洲国产精| 国产特级淫片免费看| 17c国产精品一区二区| 久久99精品久久久大学生| 日韩久久精品一区二区三区| 国产在线一卡二卡| 国产1区2区3区| 亚洲欧美日韩一级| 日日夜夜一区二区| 亚洲午夜久久久久久久久电影院| 海量av在线| 狠狠插狠狠插| 性色av色香蕉一区二区三区| 国产91精品一区| 国产一区二区播放|