日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于強(qiáng)化學(xué)習(xí)的域協(xié)調(diào)多智能體系統(tǒng)協(xié)作控制方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 202110863195.2 申請(qǐng)日: 2021-07-29
公開(kāi)(公告)號(hào): CN113625561B 公開(kāi)(公告)日: 2023-09-26
發(fā)明(設(shè)計(jì))人: 張寅;王淑晗 申請(qǐng)(專利權(quán))人: 浙江大學(xué)
主分類號(hào): G05B13/04 分類號(hào): G05B13/04;G06F30/27;G06N3/048;G06N3/08;G06N3/0464
代理公司: 杭州求是專利事務(wù)所有限公司 33200 代理人: 傅朝棟;張法高
地址: 310058 浙江*** 國(guó)省代碼: 浙江;33
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 強(qiáng)化 學(xué)習(xí) 協(xié)調(diào) 智能 體系 協(xié)作 控制 方法
【權(quán)利要求書(shū)】:

1.一種基于強(qiáng)化學(xué)習(xí)的域協(xié)調(diào)多智能體系統(tǒng)協(xié)作控制方法,其特征在于,包括如下步驟:

S1、針對(duì)待協(xié)作控制的多個(gè)機(jī)器人,將每個(gè)機(jī)器人視為多域協(xié)作場(chǎng)景中的一個(gè)智能體,對(duì)其進(jìn)行域的劃分;

S2、針對(duì)域劃分后的多域協(xié)作場(chǎng)景,基于圖網(wǎng)絡(luò)進(jìn)行多智能體建模,使全域智能體協(xié)作,形成包含集中式價(jià)值網(wǎng)絡(luò)及分散式動(dòng)作網(wǎng)絡(luò)的多智能體協(xié)作模型;所述分散式動(dòng)作網(wǎng)絡(luò)中,動(dòng)作網(wǎng)絡(luò)接收智能體的觀察作為輸入,輸出當(dāng)前所采取的動(dòng)作;所述集中式價(jià)值網(wǎng)絡(luò)接收每個(gè)智能體的觀察和動(dòng)作作為輸入,進(jìn)行域協(xié)調(diào)操作,并經(jīng)過(guò)圖卷積網(wǎng)絡(luò)提取鄰域節(jié)點(diǎn)信息,為每個(gè)智能體預(yù)測(cè)當(dāng)前狀態(tài)-動(dòng)作對(duì)的價(jià)值,用于更新集中價(jià)值網(wǎng)絡(luò)及分散動(dòng)作網(wǎng)絡(luò);且在模型中定義域協(xié)調(diào)損失函數(shù),用于指導(dǎo)域共識(shí)向量的表示學(xué)習(xí),使同一域中的智能體之間形成強(qiáng)協(xié)調(diào);

S3、使用集中訓(xùn)練、分散執(zhí)行的訓(xùn)練方式,對(duì)采用Actor-Critic框架的多智能體協(xié)作模型進(jìn)行訓(xùn)練;

S4、訓(xùn)練完成后,將模型中的各個(gè)動(dòng)作網(wǎng)絡(luò)作為策略網(wǎng)絡(luò)獨(dú)立執(zhí)行,輸入對(duì)應(yīng)智能體的觀察向量,輸出為對(duì)應(yīng)智能體的動(dòng)作向量并將其傳遞給對(duì)應(yīng)機(jī)器人,各機(jī)器人根據(jù)接收到的動(dòng)作向量進(jìn)行移動(dòng)控制,實(shí)現(xiàn)多機(jī)器人的協(xié)作控制。

2.如權(quán)利要求1所述的基于強(qiáng)化學(xué)習(xí)的域協(xié)調(diào)多智能體系統(tǒng)協(xié)作控制方法,其特征在于,步驟S1中,所述多域協(xié)作場(chǎng)景包含多個(gè)合作型關(guān)系的子組;每一個(gè)子組作為一個(gè)域,由目標(biāo)是完成同一任務(wù)的多個(gè)智能體組成;不同子組在同一場(chǎng)景中的任務(wù)目標(biāo)不同,且整個(gè)場(chǎng)景中所有智能體之間需要進(jìn)行協(xié)調(diào)以避免沖突;多域協(xié)作場(chǎng)景中使用域信息矩陣DN×N標(biāo)記智能體之間的域關(guān)系,矩陣元素dij表示智能體i和智能體j之間的域關(guān)系,同域則置1,異域則置為0。

3.如權(quán)利要求1所述的基于強(qiáng)化學(xué)習(xí)的域協(xié)調(diào)多智能體系統(tǒng)協(xié)作控制方法,其特征在于,所述域協(xié)調(diào)損失函數(shù)的計(jì)算方法為:

首先,定義智能體i的域共識(shí)向量DCi為:

其中,是對(duì)智能體i第t步的觀察ot和動(dòng)作at拼接后進(jìn)行編碼得到的初始特征向量;

然后,將每對(duì)智能體i和j的域共識(shí)向量進(jìn)行拼接后使用權(quán)重矩陣aT計(jì)算連接分?jǐn)?shù)eij,并使用sigmoid函數(shù)σ推斷智能體i和j之間連接存在的概率P(dij=1):

eij=aT[DCi||DCj]

φij=P(dij=1)=σ(eij)

式中:||表示向量拼接,φij為智能體i和j屬于同域的概率;

最后,以域信息矩陣DN×N為監(jiān)督目標(biāo),得到的域協(xié)調(diào)損失函數(shù):

其中,1是指示函數(shù),其下標(biāo)中的等式成立則函數(shù)值為1,否則為0。

4.如權(quán)利要求3所述的基于強(qiáng)化學(xué)習(xí)的域協(xié)調(diào)多智能體系統(tǒng)協(xié)作控制方法,其特征在于,所述基于圖網(wǎng)絡(luò)進(jìn)行多智能體建模的具體做法如下:

將每個(gè)智能體定義為圖上的一個(gè)節(jié)點(diǎn),智能體之間的交互就是圖節(jié)點(diǎn)之間連接的邊,從而通過(guò)圖卷積網(wǎng)絡(luò)實(shí)現(xiàn)圖上節(jié)點(diǎn)之間的消息傳遞,聚合鄰居節(jié)點(diǎn)的特征并用于更新自身節(jié)點(diǎn)特征,從而提取到相應(yīng)的狀態(tài)特征,實(shí)現(xiàn)節(jié)點(diǎn)特征的融合。

5.如權(quán)利要求4所述的基于強(qiáng)化學(xué)習(xí)的域協(xié)調(diào)多智能體系統(tǒng)協(xié)作控制方法,其特征在于,所述圖卷積網(wǎng)絡(luò)中,對(duì)于任一智能體i的節(jié)點(diǎn),以所有鄰居節(jié)點(diǎn)作為輸入,其狀態(tài)特征的計(jì)算方法為:

式中:Ni為智能體i的所有鄰居節(jié)點(diǎn),代表與智能體i同域的所有其他智能體,n為智能體i的鄰居節(jié)點(diǎn)個(gè)數(shù),diag(1)n為大小為n的對(duì)角矩陣。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110863195.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū);

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美系列一区| 国产精品一区不卡| 日韩一级视频在线| 国产日韩麻豆| 91一区二区三区在线| 国产日韩欧美91| 久久国产精品久久久久久电车| 欧美日韩国产色综合视频| 99久久久久久国产精品| 国产精品日韩一区二区| 正在播放国产一区二区| 在线精品一区二区| 亚洲福利视频二区| 午夜精品一二三区| 狠狠躁天天躁又黄又爽| 国产亚洲精品精品国产亚洲综合| 欧美久久久一区二区三区| 色偷偷一区二区三区| 免费a级毛片18以上观看精品| 国产精品人人爽人人做av片 | 国产视频一区二区不卡| 日本一区二区免费电影| 国产精品一区二区在线观看免费| 91精品国产综合久久婷婷香| 91精品丝袜国产高跟在线| 午夜电影院理论片做爰| 国产性生交xxxxx免费| 国产精品96久久久久久又黄又硬| 国产日韩区| 午夜黄色大片| 一区二区三区国产精品视频| 亚洲国产欧美国产综合一区| 国产目拍亚洲精品区一区| 国产精品香蕉在线的人| 欧美资源一区| 国产91精品高清一区二区三区| 国产精品亚洲欧美日韩一区在线| 日韩久久精品一区二区| 国产清纯白嫩初高生在线播放性色| 精品视频久| 国产乱码精品一区二区三区中文| 午夜国产一区| 免费欧美一级视频| 久久精品99国产精品亚洲最刺激| 国产伦精品一区二区三区免| 亚洲欧美一区二区精品久久久| 亚洲久久在线| 真实的国产乱xxxx在线91| 日韩av中文字幕在线| 国产精品中文字幕一区 | 国产专区一区二区| 日本大码bbw肉感高潮| 国产精品久久久久久久妇女| 国产一区二区资源| 国产一区二区精品在线| 久久精品视频3| 88888888国产一区二区| 久久97国产| 一区二区中文字幕在线| 欧美69精品久久久久久不卡| 日韩有码一区二区三区| 亚洲福利视频二区| 欧洲在线一区| 精品少妇一区二区三区| 天堂av一区二区| 亚洲午夜天堂吃瓜在线| 国偷自产一区二区三区在线观看| 日韩精品免费一区二区在线观看 | 国产精品久久99| 性色av香蕉一区二区| 国产一级自拍片| freexxxxxxx| 国产区二区| 日韩a一级欧美一级在线播放| 亚洲四区在线观看| 精品一区中文字幕| 福利电影一区二区三区| 国产精品免费自拍| 久99久精品| 午夜无人区免费网站| 日本看片一区二区三区高清| 一区二区三区欧美在线| 亚洲精品国产91| 国产欧美一区二区三区沐欲 | 欧美国产精品久久| 一区二区在线视频免费观看| 国产精品一区二区三| 国产一区二区91| 久久99久久99精品蜜柚传媒| 欧美精品免费视频| 国产精品免费不卡| 日韩精品一区二区免费| 99精品一级欧美片免费播放| 中文天堂在线一区| 国产麻豆精品一区二区| 夜夜嗨av一区二区三区中文字幕 | 国产一区二区日韩| 91久久香蕉| 国产日韩欧美不卡| 亚洲国产欧美国产综合一区| 欧美视屏一区二区| 国产99久久久精品视频| 一二三区欧美| 欧美激情综合在线| 99精品视频免费看| 国产精品v亚洲精品v日韩精品| 国偷自产中文字幕亚洲手机在线 | 国产精品伦一区二区三区在线观看| 免费91麻豆精品国产自产在线观看| 91亚洲国产在人线播放午夜| 国产精品理人伦一区二区三区| 国产69精品久久777的优势| 国产精品一二二区| 亚洲精品主播| 精品国产一区二| 夜夜爱av| 99国产精品久久久久| 国产白丝一区二区三区| 精品国产鲁一鲁一区二区三区| 午夜黄色大片| 国产午夜精品一区| 九色国产精品入口| 国产精品久久久综合久尹人久久9| 国产精品久久人人做人人爽| 国内视频一区二区三区| 国内精品在线免费| 国产精品国产三级国产专区52| 色天天综合久久久久综合片| 狠狠色噜噜综合社区| 精品国产鲁一鲁一区二区三区| 最新国产精品久久精品| 97人人模人人爽人人喊小说| 国产午夜精品一区二区三区四区| 91精品一区在线观看| 欧美一级免费在线视频| 午夜wwww| 91麻豆精品国产91久久久久| 亚洲精品国产setv| 亚洲午夜精品一区二区三区| 亚洲欧洲一区二区| 在线精品视频一区| 国产在线一二区| 午夜大片男女免费观看爽爽爽尤物| 一区二区欧美视频| 三级视频一区| 久久国产精品精品国产| 国产精品一区不卡| 国产视频1区2区| 国产精品一区在线观看| 国产一区欧美一区| 国产在线不卡一区| 玖玖玖国产精品| 国产精品欧美久久| 国产一区免费播放| 欧美乱妇在线视频播放| 国产日韩精品一区二区| 欧美在线视频精品| 99日韩精品视频| 亚洲区日韩| 免费在线观看国产精品| 国产一级片自拍| 久久久久国产精品免费免费搜索 | 国产一区二区在线观看免费| 国产在线一卡| 国产精品99一区二区三区| 久草精品一区| 亚洲欧美日本一区二区三区| 日韩欧美一区二区在线视频| 91精品色| 免费看大黄毛片全集免费| 91av一区二区三区| 国产一区二区三区网站| 国产午夜精品av一区二区麻豆 | 国产精品日韩电影| 99视频一区| 国产高清一区二区在线观看| 精品国产伦一区二区三区| 91精品久| 国产综合亚洲精品| 视频一区二区三区中文字幕| 国产欧美三区| 日本大码bbw肉感高潮| 女人被爽到高潮呻吟免费看 | 亚洲精品中文字幕乱码三区91| 日韩中文字幕亚洲欧美| 91久久免费| 91精品一二区| 久久99精品久久久久国产越南 | 亚洲精品卡一| 99re6国产露脸精品视频网站| 国产一区二区电影| 国产精品自拍在线| 久久99久久99精品免观看软件 | 波多野结衣女教师电影| 亚洲欧美日韩精品在线观看| 福利片91| 午夜裸体性播放免费观看| 午夜亚洲国产理论片一二三四| 日本一区二区三区在线视频| 日本美女视频一区二区三区| 久久天天躁夜夜躁狠狠躁2022| 一区二区三区欧美在线| 国产玖玖爱精品视频| 亚洲欧美精品suv| 日韩精品人成在线播放| 少妇厨房与子伦在线观看| 欧美精品六区| 玖玖国产精品视频| 国产精品乱码久久久久久久| 亚洲精品卡一卡二| 国产精品99一区二区三区| 国产高清一区二区在线观看| 国产一区二区激情| 偷拍精品一区二区三区| 日韩av在线免费电影| 国产网站一区二区| 国产97在线看| 亚洲一卡二卡在线| 性old老妇做受| 欧美一区二区色| 亚洲日韩欧美综合| 日韩精品少妇一区二区在线看| 99精品偷拍视频一区二区三区 | 国产91一区二区在线观看| 亚洲精品久久久久久动漫| 狠狠色噜噜狠狠狠狠米奇7777| 欧美一区二区在线不卡| 精品少妇一区二区三区免费观看焕| 国产精品一区二区三区在线看| 久久久精品中文| 91看片app| 国产精品亚洲一区二区三区| 国产偷自视频区视频一区二区| 国产区二区| 99精品一级欧美片免费播放| 亚洲欧美日本一区二区三区| 亚洲欧美国产精品一区二区| 国产一区二区三区乱码| 国产一级片一区二区| 99精品国产一区二区三区不卡| 亚洲精品国产精品国产| 国产精品一区二区在线观看| 久久99国产精品久久99| 国产欧美日韩精品一区二区图片 | 亚洲福利视频一区| 2020国产精品自拍|