日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于策略遷移的多智能體協同進化方法在審

專利信息
申請號: 202111154201.3 申請日: 2021-09-29
公開(公告)號: CN113869511A 公開(公告)日: 2021-12-31
發明(設計)人: 劉佳冀;陳思;高放;龍玉婧;王昭;席寶 申請(專利權)人: 中國電子科技集團公司信息科學研究院
主分類號: G06N3/08 分類號: G06N3/08;G06N3/04;G06N20/00
代理公司: 北京中知法苑知識產權代理有限公司 11226 代理人: 李明;趙吉陽
地址: 100086 北京*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 策略 遷移 智能 體協 進化 方法
【說明書】:

發明涉及一種基于策略遷移的多智能體協同進化方法,包括如下步驟:初始化,將每個多智能體集合為一個向量,種群包含多個向量;對種群中的向量進行變異和交叉,獲得更新的種群;獲得更新的種群中的每個向量的代價值,并將更新后的種群學習經驗存入緩存區;對緩存區的向量進行策略搜索,然后將更新后的策略和學習經驗存入緩存區;用根據個體獎勵優化得到的策略向量替換掉當前種群中最差的向量;重復上述步驟,更新種群和迭代次數,直至迭代次數達到設定次數,結束循環,得到最終的進化種群,并根據代價值找出最優向量。本發明對多智能體種群進行進化,最大化稀疏的團隊獎勵,同時通過構建基于梯度的優化訓練個體策略,最大化密集的個體獎勵。

技術領域

本發明涉及的人工智能技術領域,尤其是一種基于策略遷移的多智能體協同進化方法,通過優化團隊獎勵實現團隊協作目標,同時利用個體獎勵激勵單Agent學習基本技能,再將單Agent學習到的基本技能周期性地加入進化種群,使得差分進化算法能夠利用通過特定個體獎勵學到的技能來優化全局目標。

背景技術

強化學習(reinforcement learning,RL)是機器學習的研究方向之一,其核心思想是通過智能體(Agent)與環境的不斷交互,以最大化累計回報為目標,選擇合理的行動。目前,主要的強化學習研究方法分為三類:基于值函數的強化學習方法、基于策略搜索的強化學習方法和基于環境建模的強化學習方法。

面對大規模復雜背景下的決策問題時,單Agent系統無法實現多個決策者之間存在的相互協作或競爭關系。多智能體系統(multi-agent system,MAS)通過研究單個Agent之間的協同和交互問題,解決復雜實時動態多智能體環境下的任務調度、資源分配、行為協調以及沖突消解等協同問題。多智能體強化學習(multi-agent reinforcement learning,MARL)是當前AI領域的研究熱點。

MARL算法主要可以分為四類:基于行為分析的方法,如自我博弈(self-play)等;基于通信的方法,如RIAL(reinforced inter-agent learning)、CommNet等;基于合作的方法,如多智能體深度確定性策略梯度算法(Multi-Agent Deep Deterministic PolicyGradient,MADDPG)等;基于對手建模的方法,如M3DDPG(Minimax MADDPG)等。

在MAS中,環境通常會給予智能體兩種獎勵:基于群體協作目標的團隊獎勵、基于單個Agent基本技能的個體獎勵。在復雜的多智能體環境下,個體獎勵比較密集,容易學習,而團隊獎勵需要通過多個Agent之間的合作產生,通常比較稀疏。現有的方法,如MADDPG,只優化個體獎勵而忽略團隊獎勵,會導致生成的策略難以高效完成團隊協作目標。而只優化團隊獎勵,忽略個體獎勵,由于團隊獎勵的稀疏性,會導致訓練失敗或者面對復雜任務時樣本無效。通常解決上述問題的方法是獎勵設計,但在復雜的環境下設計獎勵十分困難,并且依賴特定環境和任務,需要手動調優,復用性差。

發明內容

本發明針對上述問題,提出了一種基于策略遷移的多智能體協同進化方法,本發明對多智能體種群進行進化,最大化稀疏的團隊獎勵,同時通過構建基于梯度的優化訓練個體策略,最大化密集的個體獎勵。基于梯度的策略被周期性地加入進化種群中,參與進化;不需要設計復雜的獎勵函數,不依賴特定環境和任務,不需要手動調優,復用性好,可以通過分別直接優化團隊獎勵和個體獎勵達到協同進化的效果。

本發明提供如下技術方案:一種基于策略遷移的多智能體協同進化方法,包括如下步驟:初始化,將每個多智能體集合為一個向量,種群包含多個向量;對種群中的向量進行變異和交叉,獲得更新的種群;獲得更新的種群中的每個向量的代價值,并將更新后的種群學習經驗存入緩存區;對緩存區的向量進行策略搜索,然后將更新后的策略和學習經驗存入緩存區;用根據個體獎勵優化得到的策略向量替換掉當前種群中最差的向量;重復上述步驟,更新種群和迭代次數,直至迭代次數達到設定迭代次數,結束循環,得到最終的進化種群,并根據代價值找出最優向量,既最佳策略。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技集團公司信息科學研究院,未經中國電子科技集團公司信息科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202111154201.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 538国产精品一区二区| 日韩精品一区二区不卡| 欧美日韩精品中文字幕| 欧美一区二区在线不卡| 国产欧美一区二区三区精品观看| 国产精品精品视频一区二区三区 | 99精品视频一区二区| 国产欧美一区二区三区不卡高清| 欧美一区二区三区激情| 亚洲欧美另类国产| 欧洲精品一区二区三区久久| 久久国产精彩视频| 国产精品一二三区视频出来一| 亚洲国产精品激情综合图片| 综合色婷婷一区二区亚洲欧美国产| 国产毛片精品一区二区| 色天天综合久久久久综合片| 日本一二区视频| 国内少妇自拍视频一区| 日本一区二区三区免费播放| 躁躁躁日日躁网站| 中文字幕一级二级三级| 国产精品日韩视频| 十八无遮挡| 日韩一区免费在线观看| 久久精品一| 国产真实乱偷精品视频免| 2023国产精品自产拍在线观看| 色综合久久精品| 伊人精品一区二区三区| 亚洲精品久久久久不卡激情文学| 午夜生活理论片| 国产视频精品一区二区三区| 国产一区二区午夜| 亚洲精品久久久久999中文字幕 | 国产精品一二三区视频出来一| 国产一区二区视频免费观看| 国产精品96久久久久久久| 蜜臀久久99精品久久一区二区| 亚洲欧美一二三| 99精品国产一区二区三区不卡| 久久精品国产综合| 国产精品视频一区二区在线观看| 欧美二区精品| 国产目拍亚洲精品区一区| 欧美在线视频三区| 欧美在线视频一区二区三区| 97久久久久亚洲| 狠狠色噜噜狠狠狠狠777| 久久精品入口九色| 日韩夜精品精品免费观看| 麻豆9在线观看免费高清1| 久久天堂国产香蕉三区| 午夜看片网站| 91麻豆精品国产91久久| av午夜影院| 国产一区二区视频免费在线观看| 国产一区二区高清视频| 日韩精品乱码久久久久久| 欧美一区二三区| 国产精品亚州| 亚洲国产精品国自产拍av | 91精品国产高清一二三四区 | 亚洲精品久久久久玩吗| 91亚洲精品国偷拍| 91精品www| 欧美片一区二区| xxxx18日本护士高清hd| 国产一区免费在线观看| 国产伦精品一区二区三区免费下载| 久久久综合亚洲91久久98| 欧美一区二区三区三州| 亚洲乱亚洲乱妇50p| 挺进警察美妇后菊| 丰满岳妇伦4在线观看| 夜夜嗨av禁果av粉嫩av懂色av| xoxoxo亚洲国产精品| 欧美日韩一区二区三区不卡视频| 狠狠色噜噜狠狠狠狠88| 欧美日韩精品在线一区二区| 日本精品视频一区二区三区| 欧美一区二区激情三区| 国产一级片大全| 国产中文字幕一区二区三区 | 国产精品麻豆99久久久久久| 香港三日三级少妇三级99| 色乱码一区二区三区网站| 国产videosfree性另类| 午夜影院5分钟| 欧美一区二区三区久久精品| 日本精品一二三区| 国产精品19乱码一区二区三区 | 精品久久久久99| 一区二区中文字幕在线观看| 在线播放国产一区| 偷拍自中文字av在线| 国产婷婷一区二区三区久久| 国产麻豆精品一区二区| 午夜a电影| 国产亚洲精品久久久久久久久动漫 | 国产一级大片| 91福利试看| 国产伦理久久精品久久久久| 国产91色综合| 日韩欧美国产精品一区| 国产精品二区一区| 亚洲精品少妇一区二区 | 亚洲va久久久噜噜噜久久0| xxxxhdvideosex| 国产亚洲精品久久网站| 午夜影院伦理片| 国产精品乱码一区二区三区四川人 | 国产免费第一区| 99久久久国产精品免费无卡顿| 欧美日韩亚洲国产一区| 欧美大成色www永久网站婷| 日韩精品免费播放| 色婷婷精品久久二区二区我来| 国产精品黑色丝袜的老师| 国产九九影院| 亚洲制服丝袜中文字幕| 国产日韩欧美不卡| 日韩亚洲精品在线观看| 99视频国产在线| 少妇自拍一区| 久久99精品国产99久久6男男| 国产精品尤物麻豆一区二区三区| 在线国产一区二区| 国产精品国产三级国产专区53| 天堂av色婷婷一区二区三区| 国产在线一卡二卡| 91久久香蕉| 日韩国产精品久久久久久亚洲| 国产白嫩美女在线观看| 狠狠色噜噜狠狠狠狠777| 三级电影中文| 99国产精品久久久久| 国产精品高清一区| 日韩一区二区中文字幕| 国产精品一区二区在线看| 91性高湖久久久久久久久_久久99| 午夜毛片影院| 欧美精品综合视频| 国产人澡人澡澡澡人碰视| 国产精品国产三级国产播12软件| 欧美亚洲精品一区二区三区| 日韩av在线播| 国产日本一区二区三区| 国产日韩麻豆| 国产精品一区二区人人爽| 国产精品二区一区二区aⅴ| 在线电影一区二区| 亚洲欧洲国产伦综合| 综合欧美一区二区三区| 亚洲日韩欧美综合| 精品99免费视频| 久久久人成影片免费观看| 中文字幕亚洲欧美日韩在线不卡| 国产精品偷乱一区二区三区| 国产第一区二区| 一区二区不卡在线| 国产伦精品一区二区三区电影| 国产97久久| 国产另类一区| 国产一区二区精品免费| 一区二区国产精品| 国产精品日产欧美久久久久| 久久99久久99精品蜜柚传媒| 中文字幕日韩有码| 99久久久久久国产精品| 国产亚洲精品久久yy50| 999国产精品999久久久久久| 日韩精品久久久久久久酒店| 亚洲高清国产精品| 又色又爽又大免费区欧美| 国产精品久久久综合久尹人久久9| 一色桃子av大全在线播放| 亚洲精品日日夜夜| 自偷自拍亚洲| 狠狠色噜噜狠狠狠狠2021天天| 精品国产一区二区三区四区vr| 国产一区二区伦理| 日本精品在线一区| 日本一区二区三区在线看| 性精品18videosex欧美| 偷拍区另类欧美激情日韩91| 日本一区二区三区在线视频| 亚洲国产精品精品| 综合国产一区| 日本久久丰满的少妇三区| 日韩av在线网址| 少妇在线看www| 天天干狠狠插| 狠狠色丁香久久综合频道| 国产精品奇米一区二区三区小说| 综合色婷婷一区二区亚洲欧美国产 | 久99精品| 中文字幕一级二级三级| 亚洲国产精品日本| 好吊妞国产欧美日韩免费观看网站| 国产一区二区播放| 亚洲国产精品区| 欧美日韩国产三区| 国产丝袜一区二区三区免费视频| 国产1区2区视频| 视频二区狠狠色视频| 狠狠色丁香久久婷婷综| 日韩亚洲欧美一区二区| 国产理论片午午午伦夜理片2021| 欧美一区二区三区白人| 久久99久久99精品蜜柚传媒| 国产午夜精品一区二区理论影院 | 久久精品一区二区三区电影| 午夜诱惑影院| 亚洲精品丝袜| xxxx18日本护士高清hd| 午夜一级电影| 国产精品你懂的在线| 精品一区欧美| 激情aⅴ欧美一区二区三区| 久久国产欧美一区二区三区精品| 夜夜爽av福利精品导航| 国产激情二区| 国产欧美视频一区二区三区| 99久久婷婷国产精品综合| 99久久夜色精品国产网站| 欧美国产一区二区三区激情无套| 日韩av在线免费电影| 国产伦精品一区二区三区电影| 亚洲午夜精品一区二区三区电影院 | 午夜激情在线| 农村妇女精品一二区| 狠狠色狠狠色综合系列| 国产69精品久久久久久久久久| xxxx国产一二三区xxxx| 国产一级片网站| 久久99精品久久久久婷婷暖91| 久久一级精品视频| 91在线一区二区| 亚洲国产一区二区精品| 国产日韩欧美精品| 99精品偷拍视频一区二区三区| 国产99久久九九精品| 国产极品一区二区三区| 视频一区二区三区欧美| 91麻豆精品国产91久久久久|