日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種多智能體深度強(qiáng)化學(xué)習(xí)方法、系統(tǒng)及應(yīng)用有效

專利信息
申請?zhí)枺?/td> 202110216405.9 申請日: 2021-02-26
公開(公告)號: CN112801290B 公開(公告)日: 2021-11-05
發(fā)明(設(shè)計)人: 張婷婷;董會;張賽男 申請(專利權(quán))人: 中國人民解放軍陸軍工程大學(xué)
主分類號: G06N3/08 分類號: G06N3/08
代理公司: 南京縱橫知識產(chǎn)權(quán)代理有限公司 32224 代理人: 何春廷
地址: 210014 江*** 國省代碼: 江蘇;32
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 智能 深度 強(qiáng)化 學(xué)習(xí)方法 系統(tǒng) 應(yīng)用
【說明書】:

發(fā)明公開了一種基于分區(qū)經(jīng)驗與多線程交互的多智能體深度強(qiáng)化學(xué)習(xí)算法。首先,該算法使用分區(qū)緩存區(qū)的經(jīng)驗重放形式,通過劃分獎勵空間來區(qū)分正面經(jīng)驗、負(fù)面經(jīng)驗與中性經(jīng)驗,并在訓(xùn)練時使用分層隨機(jī)的采樣方式抽取這些經(jīng)驗數(shù)據(jù)。其次,算法運(yùn)用多線程的交互方式促進(jìn)了智能體與環(huán)境的試錯過程,通過智能體的多個克隆體并行的學(xué)習(xí)并整合它們的學(xué)習(xí)經(jīng)驗來訓(xùn)練網(wǎng)絡(luò)模型的參數(shù)。優(yōu)點是:本發(fā)明提出的基于緩存區(qū)重放與多線程交互的多智能體深度強(qiáng)化學(xué)習(xí)算法,結(jié)合分區(qū)經(jīng)驗緩存區(qū)及多線程交互方式的優(yōu)勢,引入到多智能體的深度強(qiáng)化學(xué)習(xí)算法中;在收斂速度與訓(xùn)練效率上均優(yōu)于現(xiàn)有的模型,在多智能體環(huán)境中具有更高的可用性,可用于解決多智能體的協(xié)同追蹤目標(biāo)問題。

技術(shù)領(lǐng)域

本發(fā)明涉及一種多智能體深度強(qiáng)化學(xué)習(xí)方法、系統(tǒng)及應(yīng)用,屬于多智能體技術(shù)領(lǐng)域。

背景技術(shù)

深度強(qiáng)化學(xué)習(xí)是一種融合了深度學(xué)習(xí)(Deep Learning,DL)與強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)的高效策略搜索算法,它利用人工神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征表示能力,使強(qiáng)化學(xué)習(xí)能夠在復(fù)雜的高維狀態(tài)空間中提取數(shù)據(jù)特征并進(jìn)行最優(yōu)行為策略的搜索。目前,DRL的研究成果可應(yīng)用于多智能體系統(tǒng),以期實現(xiàn)多智能體間的相互協(xié)作、競爭對抗等復(fù)雜的作戰(zhàn)任務(wù)。但是DRL難以適應(yīng)動態(tài)多變的環(huán)境,在研究中面臨著很多的問題:一是學(xué)習(xí)效率低:DRL的本質(zhì)是試錯學(xué)習(xí)過程,通過智能體與環(huán)境的不斷交互產(chǎn)生學(xué)習(xí)經(jīng)驗并盡數(shù)地存入到緩存區(qū)中。由于經(jīng)驗質(zhì)量的參差不齊,這將導(dǎo)致網(wǎng)絡(luò)模型難以學(xué)習(xí)到有效的樣本數(shù)據(jù);二是訓(xùn)練時間長:隨著智能體數(shù)量的增加,動作空間呈現(xiàn)指數(shù)增長的趨勢,決策輸出的維度會越來越大。并且,每個智能體的行為決策不僅需要考慮所處環(huán)境的狀態(tài),還要考慮其它智能體采取的決策對自身策略的影響,這會導(dǎo)致神經(jīng)網(wǎng)絡(luò)訓(xùn)練的速度較慢甚至?xí)霈F(xiàn)難以收斂的情況。

發(fā)明內(nèi)容

本發(fā)明所要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的缺陷,提供一種多智能體深度強(qiáng)化學(xué)習(xí)方法、系統(tǒng)及應(yīng)用。

為解決上述技術(shù)問題,本發(fā)明提供一種多智能體深度強(qiáng)化學(xué)習(xí)方法,包括:

獲取預(yù)先構(gòu)建的智能體與外界環(huán)境交互式時進(jìn)行動作回饋的獎勵函數(shù),根據(jù)獎勵函數(shù)獲取整個獎勵空間,并依據(jù)獎勵的屬性將獎勵空間劃分為若干層緩存區(qū);

為每個智能體構(gòu)建多個克隆體,多個克隆體一一對應(yīng)多個線程,通過線程獲取對應(yīng)克隆體每次與環(huán)境副本進(jìn)行交互后的樣本經(jīng)驗;

匯總所有線程的樣本經(jīng)驗;

對于每個所述樣本經(jīng)驗,關(guān)聯(lián)它的獎勵的屬性,并根據(jù)獎勵的屬性將所述樣本經(jīng)驗放入對應(yīng)的緩存區(qū)中;

通過分層隨機(jī)抽樣的采樣方式從所有緩存區(qū)中抽取經(jīng)驗樣本,訓(xùn)練多智能體深度強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)路。

進(jìn)一步的,通過線程獲取對應(yīng)克隆體每次與環(huán)境副本進(jìn)行交互后的樣本經(jīng)驗,具體過程包括:

獲取線程中克隆體的環(huán)境副本、該線程的神經(jīng)網(wǎng)絡(luò)以及該神經(jīng)網(wǎng)絡(luò)的初始參數(shù),獲取克隆體利用初始參數(shù)的神經(jīng)網(wǎng)絡(luò)與環(huán)境副本交互后的樣本經(jīng)驗;根據(jù)樣本經(jīng)驗更新神經(jīng)網(wǎng)絡(luò)的參數(shù),重復(fù)樣本經(jīng)驗獲取過程,直到交互次數(shù)的總數(shù)到達(dá)預(yù)先設(shè)定的次數(shù)。

進(jìn)一步的,所述緩存區(qū)用于存放固定數(shù)量的樣本經(jīng)驗,當(dāng)達(dá)到預(yù)先設(shè)定的固定數(shù)量后,若有新的樣本經(jīng)驗輸入時,刪除最舊的經(jīng)驗。

進(jìn)一步的,所述樣本經(jīng)驗包括智能體當(dāng)前狀態(tài)s、行為a、智能體下一狀態(tài)s′和通過執(zhí)行行為a實現(xiàn)從當(dāng)前狀態(tài)s轉(zhuǎn)移到下一狀態(tài)s′得到的獎勵值r。

進(jìn)一步的,所述分層隨機(jī)抽樣中,

每層緩存區(qū)的抽樣的權(quán)重依據(jù)每個緩存區(qū)內(nèi)經(jīng)驗的數(shù)量占所有緩存區(qū)經(jīng)驗的總數(shù)的比重進(jìn)行確定。

進(jìn)一步的,將訓(xùn)練后的所述多智能體深度強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)路的參數(shù)覆蓋所有線程的神經(jīng)網(wǎng)絡(luò)的參數(shù)。

一種多智能體深度強(qiáng)化學(xué)習(xí)系統(tǒng),包括:

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍陸軍工程大學(xué),未經(jīng)中國人民解放軍陸軍工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110216405.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩久久精品一区二区三区| 国产一二区在线观看| 蜜臀久久99精品久久一区二区| 欧美福利三区| 国产真实一区二区三区| 国产69精品久久久久app下载 | 99久久免费精品视频| 综合在线一区| 国产精欧美一区二区三区久久| 亚洲欧美日韩视频一区| 狠狠色狠狠色综合久久第一次| 91精品啪在线观看国产| 夜夜精品视频一区二区| 超碰97国产精品人人cao| 91精品美女| 国产白嫩美女在线观看| 亚洲精品卡一| 国产亚洲精品久久777777 | 亚洲欧美自拍一区| 国产精品久久久久久久四虎电影| 国产精品免费不卡| 国产精品视频1区| 国产免费区| 国产欧美一区二区三区免费视频| 九一国产精品| 国产日韩一区二区三区| 精品99免费视频| 国产精品第56页| 精品国产九九| 亚洲国产一区二区久久久777| 狠狠色成色综合网| 91精品视频在线观看免费| 欧美日本三级少妇三级久久| 午夜激情电影在线播放| 欧美一区二区精品久久| 欧美激情图片一区二区| 88国产精品视频一区二区三区 | 免费看农村bbwbbw高潮| 一级黄色片免费网站| 午夜特级片| 午夜看片网| 日韩精品乱码久久久久久| 黄毛片免费| 午夜av资源| 日本免费电影一区二区| 99国产精品永久免费视频 | 国产在线卡一卡二| 欧美日韩久久一区二区| 夜夜爱av| 久久艹亚洲| 亚洲一区二区国产精品| 性old老妇做受| 亚洲精品www久久久久久广东| 欧美色综合天天久久综合精品| 欧美日韩一区电影| 欧美日韩亚洲三区| 国产乱xxxxx97国语对白| 国产一区欧美一区| 久久久久国产精品www| 国产精华一区二区精华| 日日噜噜夜夜狠狠| 欧美激情视频一区二区三区| 日韩中文字幕久久久97都市激情| 日韩中文字幕在线一区| 97人人澡人人添人人爽超碰| 久久综合国产精品| 午夜爽爽视频| 在线精品国产一区二区三区88| 8x8x国产一区二区三区精品推荐| 亚洲欧美色一区二区三区| 91看黄网站| 欧美日韩国产精品一区二区三区| 99久久免费毛片基地| 国产二区三区视频| 国内久久久| 国产福利一区在线观看| 国产亚洲精品久久yy50| 97久久超碰国产精品红杏| 精品国产乱码久久久久久虫虫| 欧美一区二区三区久久精品| 一区二区三区国产精华| 躁躁躁日日躁网站| 精品久久久久一区二区| 在线国产精品一区二区| 久久夜色精品国产亚洲| 综合欧美一区二区三区| 日韩电影在线一区二区三区| 久久综合激情网| 欧美精品亚洲一区| 国产馆一区二区| 91精品国产91热久久久做人人| 久久国产精品久久| 午夜一级电影| 国产农村妇女精品一区二区| 国产另类一区| 国产v亚洲v日韩v欧美v片| 久久一区二区精品| 国产二区视频在线播放| 日韩午夜三级| 国产精品18久久久久白浆| 国产欧美视频一区二区三区| 国产69久久久欧美一级| 亚洲精品丝袜| 亚洲精品国产久| 午夜精品一区二区三区三上悠亚| 97香蕉久久国产超碰青草软件| 狠狠色噜噜狠狠狠狠2018| 中文字幕日韩有码| 国产欧美视频一区二区| 欧美日韩一区二区三区四区五区| 性欧美一区二区| 免费看欧美中韩毛片影院| 精品一区电影国产| 亚洲精品卡一卡二| 精品国产一区二区三区高潮视| 久久久久国产亚洲| 欧美一区二粉嫩精品国产一线天| 一区二区国产精品| 四虎国产精品永久在线国在线 | 国语精品一区| 国产精品一区在线播放| 国产乱人伦精品一区二区| 精品视频久| 性刺激久久久久久久久九色| 国产乱一区二区三区视频| 97久久国产亚洲精品超碰热| 亚洲一区二区福利视频| 性欧美一区二区| 91在线一区| 日本一区欧美| 日本精品视频一区二区三区| 国产美女一区二区三区在线观看| 国产第一区二区| 午夜电影毛片| 精品国产区| 国产一级片子| 欧美日韩激情在线| 国产一区二区在线精品| 色综合久久网| 精品久久不卡| 欧美日韩一区二区三区69堂| 国产在线一卡| 欧美日韩综合一区| 91超碰caoporm国产香蕉| 久久免费视频99| 国产91高清| 一区二区三区欧美在线| 国产精欧美一区二区三区久久| 一区二区三区在线观看国产| 国产精品久久久久久久久久久久久久久久 | 国产精品丝袜综合区另类| 午夜精品99| 99久久国产综合精品色伊| 亚洲乱子伦| 国产精品美乳在线观看| 国产69久久久欧美一级| 一区二区三区日韩精品| 精品少妇一区二区三区| 精品国产91久久久| 国产午夜精品一区二区三区视频 | 激情久久影院| 久久网站精品| 久久精品99国产精品亚洲最刺激| 精品福利一区二区| 欧美精品日韩精品| 毛片大全免费观看| 日本二区在线播放| 狠狠色噜噜综合社区| 久久99久久99精品蜜柚传媒| 高清欧美精品xxxxx| 午夜影院一级| 欧美日韩一区二区高清| 久久精品色欧美aⅴ一区二区| 国产一区2区3区| 久久99精品国产麻豆婷婷| 亚洲精品suv精品一区二区| 国产69精品久久久久777| 亚洲日本国产精品| 欧美日韩中文不卡| 亚洲精品久久久久久久久久久久久久 | 91精品福利观看| 夜夜嗨av禁果av粉嫩av懂色av | 蜜臀久久久久久999| 国产精品19乱码一区二区三区| 亚洲欧美国产中文字幕| 亚洲国产视频一区二区三区| 欧美色综合天天久久| 亚洲久色影视| 日韩精品一区二区不卡| 狠狠色丁香久久婷婷综合丁香| 国产一二区在线观看| 国产在线一二区| 午夜看片网站| 粉嫩久久久久久久极品| 99国产超薄丝袜足j在线观看| 午夜免费一级片| 久久精品色欧美aⅴ一区二区| 久久99国产综合精品| 精品久久小视频| 香蕉久久国产| 午夜免费一级片| 欧美激情视频一区二区三区| 欧美在线视频精品| 国产69精品久久| 国产精品久久99| 色婷婷综合久久久久中文| 国产精品视频二区不卡| 国产二区三区视频| 国产乱了高清露脸对白| 国产午夜亚洲精品羞羞网站 | 精品91av| 国产精品天堂网| 免费看片一区二区三区| 欧美一级片一区| 午夜激情综合网| 国产精品6699| 不卡在线一区二区| 激情欧美一区二区三区| 午夜无遮挡| 久久99国产精品视频| 国产高清一区在线观看| 中文字幕一区二区三区四| 99国产精品免费观看视频re| 好吊妞国产欧美日韩免费观看网站| 日韩国产精品久久久久久亚洲| 欧美二区在线视频| 国产伦精品一区二区三区免| 日本一二三不卡| 久久96国产精品久久99软件| 国产无遮挡又黄又爽又色视频| 欧美精品国产精品| 久久99精品国产麻豆婷婷洗澡| 国产一区二区三区四区五区七| 欧美日韩国产一区二区三区在线观看| 精品香蕉一区二区三区| 欧美日韩精品在线播放| 久久一二区| 日韩午夜三级| 国产精品视频久久久久| 99久久免费精品国产免费高清| 亚洲精品乱码久久久久久按摩| 日本午夜影视| 国产精品一二三区视频出来一| 性刺激久久久久久久久九色| 精品视频在线一区二区三区| 国产精品国精产品一二三区|