日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種協作多智能體強化學習方法在審

專利信息
申請號: 202011267908.0 申請日: 2020-11-13
公開(公告)號: CN112364984A 公開(公告)日: 2021-02-12
發明(設計)人: 譚曉陽;姚興虎 申請(專利權)人: 南京航空航天大學
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08
代理公司: 南京蘇高專利商標事務所(普通合伙) 32204 代理人: 梁耀文
地址: 210016 江*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 協作 智能 強化 學習方法
【權利要求書】:

1.一種協作多智能體強化學習方法,其特征在于,包括如下步驟:

(1)采集每個智能體的觀測信息和環境的全局狀態;

(2)將步驟(1)中采集的每個智能體的觀測信息傳入值函數網絡,經過值函數網絡的計算得到智能體所有狀態動作值;

(3)根據步驟(2)中得到的每個智能體的狀態動作值,采用∈貪心算法進行單個智能體的策略選擇;

(4)將每個智能體所采取的動作的狀態動作值和全局狀態傳入獎勵高速路網絡;

(5)獎勵高速路網絡進行信息融合并輸出聯合的狀態動作值;

(6)利用環境給出的獎勵信號進行梯度的反向傳播并更新神經網絡的參數;

(7)訓練完成后得到每個智能體的策略模型,并利用該模型進行多智能體決策。

2.根據權利要求1所述的一種協作多智能體強化學習方法,其特征在于:所述步驟(2)中經過值函數網絡的計算得到智能體所有狀態動作值的具體步驟如下:

(2.1)將所述步驟(1)中采集到的每個智能體的觀測信息傳入一層全連接網絡進行特征變換,將所有智能體的觀測信息變換為同一維度;

(2.2)針對每個智能體,將經過變換的特征傳入門控循環單元即Gate RecurrentUnit,GRU,并與歷史信息進行融合得到融合后的特征;

(2.3)針對每個智能體,將特征τ傳入連接網絡輸出當前智能體所有可能動作的“狀態-動作值”。

3.根據權利要求1所述的一種協作多智能體強化學習方法,其特征在于:所述步驟(3)中采用∈貪心算法進行單個智能體的策略選擇的具體步驟如下:

(3.1)按照均勻分布的方式隨機生成區間[0,1]之間的隨機數a;

(3.2)若隨機數a大于等于給定的常數∈,則選取具有最大“狀態-動作值”的動作;

(3.3)若隨機數a小于給定的常數∈,則在智能體的動作空間中隨機選擇一個動作。

4.根據權利要求1所述的一種協作多智能體強化學習方法,其特征在于:所述步驟(5)中獎勵高速路網絡進行信息融合并輸出聯合的狀態動作值的具體步驟如下:

(5.1)全局狀態作為超網絡的輸入,生成全連接網絡的權重;

(5.2)所有智能體的動作值經過超網絡進行前向傳播,得到聯合的動作值,作為網絡的第一個輸出

(5.3)每個智能體的動作值直接與全局信號建立連接,作為網絡的第二個輸出Qi

5.根據權利要求1所述的一種協作多智能體強化學習方法,其特征在于:所述步驟(6)中利用環境給出的獎勵信號進行梯度的反向傳播并更新神經網絡的參數的具體步驟如下:

(6.1)獲取獎勵高速路網絡的聯合動作值輸出和每個智能體的動作值和每個智能體的動作值Qi

(6.2)利用全局獎勵信號R,構建優化損失函數

其中Nb為訓練批量的大小,λ為超參數,整個網絡的參數分為θ和φ兩部分,其中θ為所有智能體非中心化的值函數網絡的參數,φ為獎勵高速路網絡的參數,為當前數據所對應的時間更新目標式;

(6.3)采用基于梯度下降的優化方法最小化上述損失函數,并更新神經網絡的參數。

6.根據權利要求5所述的一種協作多智能體強化學習方法,其特征在于:所述步驟(6.2)中時間更新目標式的具體計算過程為:其中γ是獎勵折扣因子,θ--是與標準的深度Q學習算法中相同的目標網絡即target network的參數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011267908.0/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91性高湖久久久久久久久_久久99| 欧美日韩国产精品综合| 91理论片午午伦夜理片久久 | 激情欧美一区二区三区| 中文字幕亚洲欧美日韩在线不卡| 91区国产| 99久久精品国产国产毛片小说| 99久久精品一区字幕狠狠婷婷 | 少妇高潮ⅴideosex| 91精品福利在线| 国产精品久久久久久久新郎| 久久99精品国产99久久6男男| 麻豆国产一区二区| 亚洲制服丝袜中文字幕| 在线国产精品一区| 日韩av中文字幕在线免费观看| 久久久99精品国产一区二区三区 | 91婷婷精品国产综合久久| 96精品国产| 日本伦精品一区二区三区免费| 国产一区影院| 精品久久久久久亚洲综合网 | 99精品少妇| 日本美女视频一区二区| 亚洲福利视频一区| 在线国产二区| 日本少妇一区二区三区| 日韩av一区不卡| 夜夜嗨av一区二区三区中文字幕 | 日本精品三区| 精品久久久影院| 欧美一区二区三区黄| 国产91九色在线播放| 久久精品—区二区三区| 日韩精品免费一区二区中文字幕| 日本少妇一区二区三区| 国产91热爆ts人妖系列| 国产精品综合在线| 久免费看少妇高潮a级特黄按摩| 四虎国产精品永久在线| 亚洲精品性| 农村妇女精品一区二区| 97人人澡人人爽人人模亚洲| 亚洲国产精品入口| 国产精品视频久久久久久久| xx性欧美hd| 久久精品国产色蜜蜜麻豆| 国产精品6699| 亚洲第一区国产精品| 中文字幕+乱码+中文字幕一区| 久久一二区| 26uuu亚洲国产精品| 国产88av| 狠狠躁夜夜躁2020| 精品国产一区二区三区在线| 国产欧美一区二区三区四区| 中文字幕精品一区二区三区在线| 91精品啪在线观看国产线免费| 国产精品国产三级国产专区52 | 久久久久久久亚洲视频| 高清国产一区二区三区| 91视频一区二区三区| 亚洲精品一区二区三区98年| 欧美三区二区一区| 国产69精品久久久久999天美| 国产清纯白嫩初高生在线观看性色| 91午夜精品一区二区三区| 久久福利视频网| 久久国产精品久久| 91精品啪在线观看国产线免费| 国产一级片自拍| 一区二区免费播放| 久久国产精品-国产精品| 亚洲区在线| 国产一区在线免费| 国产精品一区在线观看| 狠狠色噜噜综合社区| 亚洲欧美日韩在线| 日本边做饭边被躁bd在线看| 狠狠色噜噜综合社区| 国产性猛交| 国产精品美女一区二区视频| 国产88av| 国产天堂第一区| 狠狠干一区| 亚洲国产精品精品| 国产精品久久人人做人人爽 | 亚洲福利视频二区| 91精品黄色| 亚洲精品日本久久一区二区三区 | 国产在线精品一区| 91香蕉一区二区三区在线观看| 夜夜躁日日躁狠狠躁| 国产一级在线免费观看| 国产精品一二三在线观看| 日本伦精品一区二区三区免费| 亚洲乱小说| av素人在线| 日韩av在线电影网| 国产乱xxxxx国语对白| 午夜欧美a级理论片915影院| 视频一区二区国产| 国产高清在线一区| 国产女人和拘做受视频免费| 欧美一区二区三区免费在线观看| 欧美一区二区精品久久| 国产精品一区亚洲二区日本三区| 欧美日韩久久一区| 日韩精品一区三区| 精品久久久久久久久亚洲| 中文字幕精品一区二区三区在线| 国产精品久久久麻豆| 国产精品久久久麻豆| 国产69精品久久久久777糖心| 国产精品视频1区2区3区| 日韩欧美精品一区二区| 久久精品国产亚洲7777| 久久精品国产久精国产| 国产精品视频1区2区3区| 久久人做人爽一区二区三区小说| 99国产精品| 国产精品欧美久久| 国产一区二区激情| 午夜伦理片在线观看| 亚洲欧美另类综合| 狠狠色综合久久婷婷色天使| 国产一级片大全| 亚洲乱亚洲乱妇50p| 国产伦精品一区二区三区免| 亚洲国产另类久久久精品性| 午夜精品一区二区三区在线播放| 国产高清精品一区二区| 国产精品国产三级国产专区52| 日韩av在线播放网址| 日本二区在线播放| 国产视频一区二区三区四区| 午夜欧美影院| 日韩av一区不卡| 国产日韩欧美三级| 国产一区二区伦理| 丰满岳乱妇bd在线观看k8| 亚洲一区二区国产精品| 激情久久综合| 久久国产精品99国产精| 国产精品9区| 亚洲精品色婷婷| 国产91久| 国产精品亚洲一区| 欧美精品国产一区二区| 国产91清纯白嫩初高中在线观看| 国产一卡二卡在线播放| 国产一区二区三区久久久| 亚洲国产精品国自产拍av| 欧美激情在线观看一区| 国产一区二区二| 99久久免费精品国产男女性高好| 国产麻豆精品久久| 99久久精品免费视频| 国产网站一区二区| 99爱国产精品| 国产精品国产三级国产播12软件| 国产1区2区3区中文字幕| 久久久久亚洲| 久久精品一二三四| 午夜精品999| 久久午夜精品福利一区二区| 久久第一区| 色综合久久综合| 国产一区二区三区黄| 91麻豆精品国产91久久久无限制版| 黄毛片在线观看| 亚洲精品久久久久中文字幕欢迎你| 精品国产品香蕉在线| 国产真实乱偷精品视频免| 一区不卡av| 日本aⅴ精品一区二区三区日| 玖玖国产精品视频| 欧美国产一二三区| 亚洲伊人久久影院| 欧美一区二区三区久久精品视 | www.成| 国产一卡在线| 91久久一区二区| 9999国产精品| 日本二区在线观看| 国产欧美一区二区三区沐欲| 国产精品高潮呻吟久| 亚洲精品性| 美女脱免费看直播| 国产精品日产欧美久久久久| 欧美视屏一区| 国产精品欧美一区乱破| 欧美乱妇在线视频播放| 色婷婷精品久久二区二区6| 国产一区日韩欧美| 国产1区2区3区| 精品国产一级| 狠狠躁夜夜躁2020| 国产欧美一区二区三区视频| 久久不卡一区| 国产suv精品一区二区4| 窝窝午夜精品一区二区| 91香蕉一区二区三区在线观看| 羞羞视频网站免费| 一区二区三区国产欧美| 91精品中综合久久久婷婷| 99精品偷拍视频一区二区三区| 精品国产鲁一鲁一区二区作者| 久久激情影院| 精品91av| 亚洲国产aⅴ精品一区二区16| 久久99精品久久久野外直播内容| 国产精品久久久久久久久久久新郎 | 日韩精品一区在线观看| 国产乱xxxxx97国语对白| 狠狠插影院| 日本高清一二区| 国产精品自产拍在线观看蜜| 国模少妇一区二区三区| 国产精品尤物麻豆一区二区三区 | 91日韩一区二区三区| 日本高清h色视频在线观看| 国产1区2区3区| 狠狠色噜噜狠狠狠狠| 国产精品一区二区在线观看| 91九色精品| 午夜理伦影院| 久久精品国产亚洲一区二区| 国产.高清,露脸,对白| 国产一区网址| 97精品国产97久久久久久免费| 国产一区二区麻豆| 午夜特级片| 欧美日韩亚洲另类| 精品国产免费久久| 国产中文字幕一区二区三区| 99久久免费精品视频| 日本一区二区三区在线视频| 色妞www精品视频| 91精品国产高清一二三四区| 日本一区中文字幕| 国产精欧美一区二区三区久久久| 国产精选一区二区| 国产精品日韩精品欧美精品| 国产一区二区资源| 日本一区二区三区免费视频|