日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]多智能體協作信息處理方法、系統、存儲介質、智能終端在審

專利信息
申請號: 202010211670.3 申請日: 2020-03-23
公開(公告)號: CN111582469A 公開(公告)日: 2020-08-25
發明(設計)人: 鄒長杰;鄭皎凌;張中雷 申請(專利權)人: 成都信息工程大學
主分類號: G06N3/08 分類號: G06N3/08;G06N3/02;G06N20/00
代理公司: 北京元本知識產權代理事務所(普通合伙) 11308 代理人: 王紅霞
地址: 610225 四川省成都*** 國省代碼: 四川;51
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 智能 體協 信息處理 方法 系統 存儲 介質 終端
【說明書】:

發明屬于人工智能技術領域,公開了一種多智能體協作信息處理方法、系統、存儲介質、智能終端,每個agent在環境中每采取下一步行為在環境中留下自己的信息微量,當其它agent到達環境中狀態時會先搜索周圍的信息微量,把信息微量加入到神經網絡中進行訓練;分組模型找到多智能體之間更好的合作策略,分組模型使用多智能體之間的分組關系,預測出多智能體在下一時刻的最優分組;在每次經過G模型訓練一回合結束時,把每個agent的損失函數公式看作適應度,統計每一回合智能體軌跡的損失值均值,匯總每一回合所有agent軌跡的損失值。本發明提高了多智能體的團隊學習效率,實現多智能體能夠團隊協作更好的完成任務。

技術領域

本發明屬于人工智能技術領域,尤其涉及一種多智能體協作信息處理方法、系統、存儲介質、智能終端。

背景技術

目前,多智能體協作是在實際應用的新課題,也是一項富有挑戰意義的課題。a)如何讓多智能體在更大和隨機環境中仍然能夠高效地學習是強化學習一直存在的挑戰。強化學習中一些算法采用策略迭代方式訓練智能體,可以泛化到更大尺寸的環境中,但是這種方式只能用在單智能體算法的優化上,在多智能體系統中,此種方式就沒那么適用了。b)讓多智能體能像人一樣組隊合作完成目標是一項新課題。深度強化學習使用異步框架來訓練多智能體,每個智能體相對于其它智能體都是獨立的,如果出現各個智能體分工不一樣的情況,異步框架就不適用了。一些多智能體算法中智能體的交互是全連接,這樣不僅增加算法復雜度更難應用到現實中。c)如何管理多智能體訓練學習中的生和滅也是多智能體強化學習的一個難題。多智能體訓練學習中,不管智能體學習的好和壞,每回合都會同時結束當前訓練。因此,讓學習好的智能體繼續訓練,學習差的智能體重新學習也是一項挑戰。

現有技術缺點:

a)基于策略梯度的單智能體強化學習

強化學習分為兩大類:有模型強化學習、無模型強化學習,其中無模型又可以分為基于值和基于策略。自從2015年引入強化學習以來,Q-learning、Sarsa和TD-lambda等算法成為強化學習的主流。Q-learing、Sarsa、TD-lambda都是無模型基于值迭代的算法,使用時間差分法TD,無需等待到終止時間才進行更新,而是在下一步行動前就可以進行估計的更新。與蒙特卡洛方法相比時間差分法TD會進行極大雖然估計,使得估計的結果更符合未來數據的趨勢。深度強化學習(Deep Reinforcement Learning,DRL),它將具有決策的強化學習和具有感知的深度學習相結合。最初,它被應用于視頻游戲領域,隨著深度強化學習的不斷創新,它解決了越來越多的問題,如控制機器人,工廠智能機器人手臂,人臉識別,視頻分析。DQN在Q-learning的改進下被提出來,它解決了Q-learning“緯度災難”的問題。DQN做的三大改進為:使用經驗重放和目標網絡穩定基于DL的近似動作值函數;使用端到端方法,將CNN網絡將原始圖片和游戲得分作為輸入,使得模型僅需較少的領域知識;訓練出可變的網絡,在多任務中具有良好的表現,有些實驗結果還超越人類專業玩家。為了消除強化學習數據之間的強相關性,DQN使用均勻采樣經驗重放機制來訓練神經網絡,然而均勻采樣方法忽略了不同經驗的重要性程度,因此,提出了優先經驗重放,利用TD error對智能體經驗的重要性進行衡量和重放多次,進而提高學習效率。Hasselt等人[7]在DQN基礎上提出DoubleDQN算法,將動作選擇和價值估計分開,避免價值過高估計。和上面所提到的基于值迭代算法不同的是,Policy Gradient算法往往采用的回合更新,也就是要到一輪結束后才能進行更新,這樣在評估一個策略時通常效率較低。Actor-Critic結合Policy Gradient和TD算法,采用單步更新解決評估策略低效的問題。在AC算法的基礎上DPG、A3C被提出來,其中A3C與DQN經驗重放機制不同,采用并行訓練方法打破了訓練數據間的相關性。相比AC算法,A3C可大幅度提升算法的學習效率。和AC不同的是,DPG算法采用TD的方式降低方差,能更好地應用于off-policy。DDPG算法由DPG算法改進而來,其在輸入上僅僅依賴狀態空間,可以應對高維的輸入,實現端對端的控制,還可以輸出連續動作,使得深度強化學習方法可以應用于較為復雜動作空間和連續動作空間。TRPO結合Policy Gradient和蒙特卡洛方法,通過一步步改進梯度策略,提高算法的穩定性。PPO算法和TRPO算法近似,該算法更能適應大規模的運算,在實現的難易程度、采樣復雜度、調試所需精力之間取得了新的平衡。盡管現有的單智能體算法很成熟,但是當任務變為多個智能體合作模式,就打破了單智能體算法的基本前提,環境變得非穩定性,單智能體算法算法就很難學習好策略。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都信息工程大學,未經成都信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010211670.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产日韩欧美精品一区二区 | 91免费视频国产| 国产jizz18女人高潮| 午夜免费av电影| 456亚洲精品| 国产一区二区午夜| 99久久免费精品视频| 中文字幕二区在线观看| 中文字幕一区三区| 久久久精品二区| 国产精品伦一区二区三区视频| 国产精品电影一区| 久久国产激情视频| 亚洲国产精品入口| 天堂av一区二区三区| 久久er精品视频| 午夜大片男女免费观看爽爽爽尤物 | xxxx国产一二三区xxxx| 午夜a电影| 亚洲精品一品区二品区三品区 | 国产69精品久久99的直播节目| 日韩精品中文字| 国产97在线播放| 91亚洲国产在人线播放午夜| 久久久久亚洲| 日韩av中文字幕一区二区| 欧美视屏一区二区| 欧美一区二区三区四区夜夜大片| 欧美一区二区精品久久| 激情久久一区| 91久久久久久亚洲精品禁果| 国产伦精品一区二区三区四区| 国产1区2区3区中文字幕| 国产一区二区免费在线| 日韩精品久久久久久久电影99爱| 亚洲午夜精品一区二区三区| 日韩欧美一区精品| 亚洲国产精品入口| 日本一区二区三区免费视频| 亚洲色欲色欲www| 欧美日韩一区二区电影| 搡少妇在线视频中文字幕| 日韩精品中文字幕在线播放| 国产精品欧美一区二区三区| 亚洲网久久| 亚洲欧美另类久久久精品2019 | 国产精品一区二区三| 国产精品国产三级国产专区55| 国产精品二十区| 国产1区2区3区中文字幕| 91麻豆精品国产91久久久久推荐资源| 国产三级欧美三级日产三级99| 超碰97国产精品人人cao| 草逼视频网站| 国产精品日韩电影| 国产精品一区二区免费视频| 免费久久一级欧美特大黄| 亚洲精品乱码久久久久久国产主播| 亚洲va久久久噜噜噜久久0| 国产精品日韩一区二区三区| 在线视频国产一区二区| 欧美精品xxxxx| 国产日韩欧美在线影视| 国产精品欧美一区二区三区奶水| 亚洲欧洲日韩av| 亚洲第一区国产精品| 国产精品天堂| 国产欧美一区二区精品久久| 国产足控福利视频一区| 99re热精品视频国产免费| 午夜av资源| 一区二区在线不卡| 国产69精品久久99不卡免费版| 精品国产精品亚洲一本大道| 国产999精品视频| 国产高清不卡一区| 激情欧美一区二区三区| 国产真实乱偷精品视频免| 欧美资源一区| 精品国产伦一区二区三区| 久久久99精品国产一区二区三区| 强行挺进女警紧窄湿润| 97久久精品人人做人人爽 | 性欧美1819sex性高播放| 国产精品久久久久久久久久不蜜月| 欧美一级久久久| 午夜一级电影| 国产精品麻豆自拍| 亚洲精品中文字幕乱码三区91| 丝袜脚交一区二区| 免费久久一级欧美特大黄| 天干天干天干夜夜爽av| 免费毛片a| 亚洲自偷精品视频自拍| 17c国产精品一区二区| 国产激情视频一区二区| 99久久国产综合精品尤物酒店| 精品99免费视频| 国产精品久久久综合久尹人久久9| 午夜激情免费电影| 欧美髙清性xxxxhdvid| 午夜情所理论片| 综合色婷婷一区二区亚洲欧美国产 | 少妇又紧又色又爽又刺激的视频| 理论片午午伦夜理片在线播放 | 国产精品免费一区二区区| 一区二区三区国产精品| 久久99亚洲精品久久99果| 国产精彩视频一区二区| 99久热精品| 国产精品麻豆99久久久久久| 在线国产一区二区| 亚洲午夜久久久久久久久电影院| 亚洲少妇一区二区| 91黄色免费看| 国产视频在线一区二区| 欧美一区二区三区黄| 久久夜靖品2区| 片毛片免费看| 91一区二区三区在线| 日韩欧美亚洲视频| 久久第一区| 久久精品国语| 国内精品99| 国产高清在线观看一区| 国产午夜三级一二三区| 亚欧精品在线观看| 欧美一区二区三区激情视频| 国产在线拍揄自揄拍| 国产日韩欧美另类| 日韩久久精品一区二区| 狠狠躁夜夜躁人人爽天天天天97| 久久久久国产精品一区二区三区| 亚洲精品久久久久一区二区 | 亚洲欧美一二三| 欧美午夜羞羞羞免费视频app| 欧美日韩国产精品一区二区亚洲| 国产一区二区视频播放| 国产一区二区视频播放| 久久国产精品久久| 91免费国产视频| 91片在线观看| 国内揄拍国产精品| 色综合久久久久久久粉嫩| 国产69精品久久777的优势| 中文字幕一区二区三区免费视频| 久久久一二区| 午夜看片网站| 91一区二区三区视频| 日韩一级片免费观看| 精品国产九九| 国产免费一区二区三区四区| 91精品资源| 久久久精品99久久精品36亚| 色乱码一区二区三区网站| 欧美日韩国产91| 亚洲自拍偷拍一区二区三区| 日韩欧美国产中文字幕| 国产69精品福利视频| 538国产精品一区二区在线| 国产女人与拘做受免费视频| 日本二区在线观看| 草逼视频网站| 亚洲福利视频二区| 亚洲欧美国产日韩综合| 午夜毛片在线观看| 国产亚洲精品久久yy50| 免费**毛片| 欧美精品九九| 欧美性受xxxx狂喷水| 欧美在线视频精品| 激情久久一区| 日韩av在线网| 超碰97国产精品人人cao| 91视频一区二区三区| 91av精品| 性少妇freesexvideos高清bbw| 高清国产一区二区三区| 国产精品99999999| 久久九精品| 久久精品综合视频| 国产亚洲久久| 91麻豆精品一区二区三区| 久久一级精品视频| 久久三级精品| 欧美日韩一区二区三区精品| 久久久久久久久久国产精品| 精品国产鲁一鲁一区二区三区| 欧美3级在线| 视频一区二区中文字幕| 在线国产一区二区三区| 4399午夜理伦免费播放大全| 国产精品18久久久久久白浆动漫| 大伊人av| 国产电影精品一区| 国产欧美一区二区精品久久| 91精品国产91久久久| 久精品国产| 黄毛片免费| 欧美日韩一区二区三区在线播放 | 天摸夜夜添久久精品亚洲人成| 欧美二区在线视频| 在线中文字幕一区| 97精品久久人人爽人人爽| 国产精品久久久不卡| 国产理论一区| 国产精品99999999| 97欧美精品| 狠狠躁夜夜躁| 国产偷久久一区精品69| 欧美激情午夜| 国产亚洲精品久久午夜玫瑰园| 日韩欧美国产中文字幕| 亚洲国产精品美女| 精品国产18久久久久久依依影院| 久久91久久久久麻豆精品| 久久一级精品| 精品国产区| 久久天天躁夜夜躁狠狠躁2022| 精品久久久久久久免费看女人毛片| 久久一级精品视频| 欧美一区二区三区免费观看视频| 国久久久久久| 国产日韩精品一区二区| 李采潭无删减版大尺度| 日本一二三区视频在线| 日本三级香港三级| 国产精品高清一区| 真实的国产乱xxxx在线91| 欧美日韩一级二级| 又色又爽又大免费区欧美| 欧美日韩一级二级| 国产日产精品一区二区三区| 精品一区欧美| 久久精品一二三| 日韩精品中文字幕在线| 99久久免费精品视频| 高清国产一区二区三区| 午夜精品一区二区三区在线播放| 欧美视屏一区| 日韩一级视频在线| 国产乱色国产精品播放视频| 国产真裸无庶纶乱视频| 欧美日韩三区| 国产精品一二三四五区| 久久er精品视频|