日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于多Agent環境的深度強化學習算法、設備和存儲介質有效

專利信息
申請號: 202211114004.3 申請日: 2022-09-14
公開(公告)號: CN115392438B 公開(公告)日: 2023-07-07
發明(設計)人: 王旭;周詩佳;張宇;尤天舒;徐勇;富倩;孫偉;李力東;杜麗英;戴傳祗 申請(專利權)人: 吉林建筑大學
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08;G06N20/00;G06Q10/04
代理公司: 重慶三航專利代理事務所(特殊普通合伙) 50307 代理人: 萬文會
地址: 130118 吉*** 國省代碼: 吉林;22
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 agent 環境 深度 強化 學習 算法 設備 存儲 介質
【權利要求書】:

1.一種基于多Agent環境的深度強化學習算法,其特征在于,應用于多Agent環境中的深度強化學習模型,所述深度強化學習算法包括:

步驟S101、利用所述Agent中的目標網絡,基于智能體樣本的初始狀態信息,確定時間差分;所述智能體樣本為獵物智能體和捕食者智能體;所述Agent中的目標網絡用于基于所述智能體樣本,模擬所述獵物智能體和所述捕食者智能體在障礙環境中的競爭路徑或合作路徑;所述Agent中的目標網絡包括目標critic網絡和目標actor網絡;所述時間差分基于當前價值信息以及預設的環境獎懲參數確定;所述當前價值信息基于所述目標critic網絡對所述初始狀態信息和當前策略信息進行評價得到;所述當前策略信息基于所述目標actor網絡對所述初始狀態信息進行預測得到;

步驟S102、根據預設的遮蓋率,對所述初始狀態信息進行隨機遮蓋,得到目標狀態信息;利用所述Agent中的預測網絡,根據所述目標狀態信息、智能體樣本的動作信息以及所述時間差分,確定誤差值;預設的所述遮蓋率基于random函數對所述初始狀態信息隨機遮蓋后,所述Agent中的預測網絡對遮蓋后的初始狀態信息進行預測得到;

步驟S103:基于所述誤差值,以及自適應修改參數,對所述Agent中的預測網絡和所述Agent中的目標網絡各自對應的加權值進行更新;

步驟S104:重復步驟S102和步驟S103至預設次數,確定目標加權值,根據所述目標加權值確定目標深度強化學習模型;所述目標深度強化學習模型用于確定獵物智能體和捕食者智能體在障礙環境下的合作路徑或競爭路徑。

2.根據權利要求1所述的基于多Agent環境的深度強化學習算法,其特征在于,所述Agent中的目標網絡包括目標actor網絡和目標critic網絡;

所述利用所述Agent中的目標網絡,基于智能體樣本的初始狀態信息,確定時間差分,包括:

將所述初始狀態信息輸入至所述目標actor網絡中進行預測,得到當前策略信息;

將所述初始狀態信息和所述當前策略信息輸入至所述目標critic網絡中進行評價,得到對應的當前價值信息;

根據所述當前價值信息以及預設的環境獎懲參數,確定所述時間差分。

3.根據權利要求1所述的基于多Agent環境的深度強化學習算法,其特征在于,所述Agent中的預測網絡包括critic網絡;

所述利用所述Agent中的預測網絡,根據所述目標狀態信息、智能體樣本的動作信息以及所述時間差分,確定誤差值,包括:

將所述目標狀態信息和所述智能體樣本的動作信息輸入至所述critic網絡中進行預測,得到目標價值信息;

根據所述目標價值信息和所述時間差分,確定所述誤差值。

4.根據權利要求3所述的基于多Agent環境的深度強化學習算法,其特征在于,所述Agent中的預測網絡包括actor網絡;

所述基于所述誤差值,以及自適應修改參數,對所述Agent中的預測網絡和所述Agent中的目標網絡各自對應的加權值進行更新,包括:

基于所述誤差值,對所述critic網絡的加權值進行更新;

對所述智能體樣本的動作信息進行抽樣,得到目標動作信息,根據所述目標動作信息對所述actor網絡的加權值進行更新;

根據更新后的actor網絡的加權值和更新后的critic網絡的加權值,以及所述自適應修改參數,對所述目標actor網絡和所述目標critic網絡各自對應的加權值進行更新。

5.根據權利要求4所述的基于多Agent環境的深度強化學習算法,其特征在于,所述根據更新后的critic網絡的加權值和更新后的actor網絡的加權值,以及所述自適應修改參數,對所述目標actor網絡和所述目標critic網絡各自對應的加權值進行更新,包括:

基于預設的自適應加權平均更新模型,確定所述自適應修改參數;

根據所述自適應修改參數,確定網絡更新模型;

根據網絡更新模型,以及所述更新后的critic網絡的加權值和所述更新后的actor網絡的加權值,對所述目標actor網絡和所述目標critic網絡各自對應的加權值進行更新。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林建筑大學,未經吉林建筑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202211114004.3/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美精品在线观看一区二区| 538国产精品| 91看片片| 午夜精品一区二区三区aa毛片| 国产一级一区二区| 午夜理伦影院| 久久亚洲精品国产日韩高潮| 国产极品一区二区三区| 99久久婷婷国产精品综合| 午夜电影一区二区三区| 国产精品丝袜综合区另类| 一区二区久久精品66国产精品| 国产精品欧美久久久久一区二区| 久久精品国产亚| 日韩午夜电影在线| 亚洲精品国产久| 日韩一级在线视频| 国产在线视频99| 日韩av在线网址| 亚洲四区在线| 国内少妇自拍视频一区| 2023国产精品久久久精品双| 久精品国产| 欧洲在线一区| 日本二区在线观看| 国产日韩欧美中文字幕| 久久99久久99精品蜜柚传媒| 亚洲精品性| 日本一二区视频| 久久精品国产综合| 国产乱对白刺激视频在线观看| 亚洲三区在线| 日韩亚洲国产精品| 日韩欧美精品一区二区三区经典| www.午夜av| 91精品高清| 国产三级一区二区| 亚洲欧美日本一区二区三区| 欧美日韩偷拍一区| 色乱码一区二区三在线看| 国产二区免费| 综合欧美一区二区三区| 国产精品日韩高清伦字幕搜索| 午夜性电影| 国产精品日韩精品欧美精品 | 国产精品你懂的在线| 99国产精品免费| 欧美一区二区三区片| 免费看欧美中韩毛片影院| 国内精品99| 亚洲欧美日韩一级| 亚洲精品www久久久| 日韩精品一区二区三区免费观看视频| 久久九九国产精品| 91精品一区在线观看| 狠狠躁狠狠躁视频专区| 欧美日韩亚洲三区| 一级久久久| 久久99久久99精品免观看软件 | 日本午夜久久| 99久久精品一区二区| 午夜免费片| 国产精品白浆视频| 久久人91精品久久久久久不卡| 日韩中文字幕区一区有砖一区| 欧美综合国产精品久久丁香| 久久国产中文字幕| 欧美精品粉嫩高潮一区二区 | 一级午夜影院| 国产一区二区三区中文字幕| 日韩av在线影院| 一区二区三区四区中文字幕 | 另类视频一区二区| 日韩av在线一区| 国产午夜精品免费一区二区三区视频| 93久久精品日日躁夜夜躁欧美| 综合色婷婷一区二区亚洲欧美国产| 中文字幕欧美日韩一区| 91午夜精品一区二区三区| 亚洲精品主播| 国产在线精品一区二区| 国产精品久久久久久久龚玥菲| 国产1区2区3区中文字幕| 91麻豆精品国产自产欧美一级在线观看 | 日韩av在线播| 91婷婷精品国产综合久久| 国产日韩欧美网站| 国产乱人伦精品一区二区| 日韩精品1区2区3区| 国产麻豆精品久久| 在线观看v国产乱人精品一区二区 国产日韩欧美精品一区二区 | 亚洲精品一区,精品二区| 免费毛片a| 日韩精品久久久久久久的张开腿让| 久久精品—区二区三区| 91精品国产高清一二三四区| 久久久久国产精品一区二区三区| 最新国产精品久久精品| 精品国产乱码久久久久久虫虫| 国产欧美一区二区精品久久| 日韩偷拍精品| 欧美视频1区| 国产另类一区| 中文字幕一二三四五区| 亚洲五码在线| 欧美高清xxxxx| 亚洲欧美一区二| 亚洲一区二区三区加勒比| 国产精品视频久久| 亚洲w码欧洲s码免费| 午夜精品999| 97人人模人人爽人人喊小说 | 91丝袜国产在线播放| 日韩精品一区三区| 国产精品一级在线| av不卡一区二区三区| 国产精品一区二区人人爽| 久久久一区二区精品| 国产电影精品一区二区三区| 伊人精品一区二区三区| 色噜噜狠狠色综合久| 国产乱码精品一区二区三区介绍| 曰韩av在线| 美女脱免费看直播| 亚洲日本国产精品| 欧美3级在线| 猛男大粗猛爽h男人味| 久爱视频精品| 精品国产一区二区三| 26uuu亚洲国产精品| 国产精品一区二区在线观看免费| 国产一级片子| 国产不卡一区在线| 欧美hdxxxx| 日韩国产精品久久久久久亚洲| 欧美xxxxhdvideos| 在线观看欧美一区二区三区| 国产一区二区三区网站| xxxxx色| 欧美一区二区三区日本| 激情久久综合| 久久99国产精品久久99| 视频一区二区中文字幕| 少妇av一区二区三区| 大桥未久黑人强制中出| 一本一道久久a久久精品综合蜜臀| 欧美3p激情一区二区三区猛视频| 久久99精品国产99久久6男男| 人人要人人澡人人爽人人dvd| 日韩午夜毛片| 欧美日韩激情在线| 日本五十熟hd丰满| 福利片一区二区三区| 艳妇荡乳欲伦2| 岛国黄色av| 久久久人成影片免费观看| 二区三区免费视频| 亚洲精品日本久久一区二区三区| 国产视频1区2区| 欧美在线观看视频一区二区三区| 大bbw大bbw超大bbw| 亚洲精品久久久中文| 久久国产精品二区| 日本五十熟hd丰满| 日韩偷拍精品| 国产女性无套免费看网站| 激情久久一区二区三区| 欧美日韩一级二级三级| 日本丰满岳妇伦3在线观看 | 国产一二区在线观看| 国产精品综合一区二区三区| 99精品区| 91精品综合| 国产视频一区二区在线| 一级午夜电影| 久久精品视频一区二区| 日韩久久精品一区二区三区| 99国产精品一区| 中文字幕欧美另类精品亚洲| 国产一区二区电影| 毛片大全免费看| 91精品福利观看| 国产欧美亚洲精品| 国产精品国产一区二区三区四区| 国产日韩欧美在线一区| 在线中文字幕一区| 一区二区在线不卡| 精品国产18久久久久久依依影院| 午夜爱爱电影| 日韩精品一区三区| 91麻豆精品国产91久久久更新资源速度超快 | 日韩精品一区三区| 狠狠色噜噜综合社区| 久久精品亚洲精品国产欧美| 国产精品suv一区二区6| 91麻豆精品国产91久久| 久久99精品久久久久婷婷暖91| 挺进警察美妇后菊| 强制中出し~大桥未久10| 日韩一区免费| 国产亚洲久久| 夜色av网| 国产精品一区在线播放| 999偷拍精品视频| 久精品国产| 99久久婷婷国产综合精品电影 | 91亚洲精品国偷拍| 亚洲s码欧洲m码在线观看| 91精品视频在线观看免费| 91免费视频国产| 久久乐国产精品| 国内精品99| 欧美在线视频三区| 欧美一区二区三区激情在线视频| 日日夜夜亚洲精品| 国产欧美一区二区精品久久| 97人人模人人爽人人喊38tv| 91精品丝袜国产高跟在线| 国产在线拍偷自揄拍视频| 伊人久久婷婷色综合98网| 国产精品一区二区av麻豆| 狠狠躁天天躁又黄又爽| 精品一区二区三区自拍图片区| 色狠狠色狠狠综合| 国产精品不卡一区二区三区 | 91九色精品| 91精品视频免费在线观看| 久久综合国产伦精品免费| 欧美三级午夜理伦三级中视频| 欧美久久精品一级c片| 精品国产一区在线| 免费久久99精品国产婷婷六月 | 国产精品久久91| 国产麻豆91欧美一区二区| 国产欧美精品va在线观看| 国产午夜一级一片免费播放| 二区三区免费视频| 久久一二区| 狠狠躁日日躁狂躁夜夜躁av| 欧美在线视频一区二区三区| 香蕉免费一区二区三区在线观看| 国产日韩欧美精品一区二区| 欧美亚洲精品一区二区三区| 一区不卡av| 欧美日韩国产在线一区二区三区| 国产全肉乱妇杂乱视频在线观看|