日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種博弈策略優化方法、系統及存儲介質有效

專利信息
申請號: 202010399728.1 申請日: 2020-05-13
公開(公告)號: CN111291890B 公開(公告)日: 2021-01-01
發明(設計)人: 王軒;漆舒漢;張加佳;胡書豪;黃旭忠;劉洋;蔣琳;廖清;夏文;李化樂 申請(專利權)人: 哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院)
主分類號: G06N5/04 分類號: G06N5/04;G06N3/08;G06N20/00
代理公司: 深圳市添源知識產權代理事務所(普通合伙) 44451 代理人: 羅志偉
地址: 518000 廣東省深圳市南*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 博弈 策略 優化 方法 系統 存儲 介質
【權利要求書】:

1.一種博弈策略優化方法,該博弈策略優化方法基于多智能體強化學習和虛擬自我對局進行實現,其特征在于,包括如下步驟:

建立基于最大熵的策略遞度算法步驟:在最大熵強化學習中,除了要最大化累計期望收益這個基本目標,還要最大化策略熵:

其中在狀態 下智能體選擇動作 獲得的獎勵, 表示策略 在狀態 下的策略熵, 表示決定策略熵項重要程度的溫度系數,相當于用來控制智能體策略的隨機性,如果 則退化為傳統的強化學習算法;

多智能體最優反應策略求解步驟:采用中心化訓練分散式執行的方式來求解最優策略,通過基線獎勵評估合作博弈中的智能體收益;

將該博弈策略優化方法應用于多人游戲中,實現多智能體博弈;

將該博弈策略優化方法應用于多人游戲中的實現方式是:根據博弈場景特點提取每個智能體所處環境的原始狀態表示矩陣,編碼為一個11*11*19的狀態表征向量,作為網絡輸入;原始狀態表示矩陣中需要包括地圖信息、智能體炸彈威力、敵方智能體信息、存活時長;網絡主體結構采用卷積神經網絡結構;分為訓練和測試2個步驟,訓練時采用虛擬自我對局框架,其中最優反應策略求解采用中心化訓練分散式執行框架,通過智能體共享的全局信息和動作訓練了一個中心化的估值網絡Critic,并在損失函數中添加了策略熵來平衡探索和利用,Actor網絡用來擬合智能體的全局最優反應策略;訓練時,平均策略則是采用對Actor進行行為克隆從而更新網絡參數;在訓練和測試時均通過平均策略決定每個智能體的動作,平均策略的狀態輸入與最優反應策略一致,且共用一個主體卷積模塊進行特征映射,假設N是智能體的可選動作總數,平局策略輸出是一個N維向量,表示每個智能體的動作概率分布,即智能體策略,智能體將采取N維向量中概率最大的動作;

在所述多智能體最優反應策略求解步驟中,采用中心化訓練分散式執行的方式來求解最優策略的具體技術方案是:在訓練階段允許利用其他智能體的可見信息,在智能體根據策略執行動作時則僅根據自身可見信息做出判斷,對于智能體i的估值網絡Critic的損失函數如下:

其中為智能體i估值網絡的輸出,該網絡的輸入 中的表示智能體之間共享的全局信息,而 表示第i個智能體的動作,y為估值網絡 輸出的擬合目標,y中的 表示智能體i的獎勵,表示智能體i延遲更新的目標策略網絡輸出;

對于智能體 i的策略網絡 Actor 的梯度公式如下:

其中 表示策略組 中的策略網絡參數,而 則是中心化訓練的值網絡的輸出;

在所述多智能體最優反應策略求解步驟中,通過基線獎勵評估合作博弈中的智能體收益的具體技術方案是:利用一個集中的評估網絡Critic評估所有智能體的行為,通過中心化的對狀態s下的聯合動作u進行估值,對于每個智能體 a都可以計算一個當前動作 的優勢函數,其中用到的基線則是由與 無關的默認動作產生的,同時需要保持其他智能體的動作 固定,可得到以下優勢函數:

第一項表示選取動作 得到的全局收益,該獎勵可以通過中心化的 Critic 計算得到,第二項中 表示智能體a基于選擇動作的概率,第二項整項表示智能體a在所有可能選擇動作下可以獲得的全局獎勵期望,以此來作為基線獎勵,以前后兩項的差來衡量智能體當前選擇的動作相對于期望全局收益的增益多少。

2.根據權利要求1所述的博弈策略優化方法,其特征在于,在所述建立基于最大熵的策略遞度算法步驟中,溫度系數a的損失函數如下:

其中表示在狀態 下智能體選擇動作 的概率分布,上述公式的意義就是保持策略熵大于的同時來優化策略,可以實現在博弈策略優化的不同階段溫度系數 α 可變。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院),未經哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010399728.1/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国内视频一区二区三区| 欧美日韩一级在线观看| 国产精品一区二区日韩新区| 国产一区二区三区四区五区七| 91精品视频在线免费观看| 国产麻豆91视频| 亚洲国产欧洲综合997久久,| 国产精品美女www爽爽爽视频| 色综合久久精品| 日韩国产精品一区二区| 日韩av一区不卡| 久久青草欧美一区二区三区| 亚洲区在线| 欧美日韩国产色综合视频| 国产大片黄在线观看私人影院| 中文字幕一级二级三级 | 欧美一区二区三区高清视频| 亚洲码在线| 亚洲s码欧洲m码在线观看| 午夜电影院理论片做爰| 日本一区二区欧美| 农村妇女精品一二区| 国产欧美日韩一区二区三区四区| 国产精品二区在线| 午夜av片| 欧美激情精品一区| 亚洲欧美国产精品va在线观看| 久久亚洲精品国产一区最新章节| 国产精品二区在线| 欧美乱妇高清无乱码一级特黄| 国产69久久| 日本伦精品一区二区三区免费| 私人影院av| 亚洲国产另类久久久精品性| 蜜臀久久99精品久久一区二区| 久久精品国产一区二区三区不卡| 麻豆91在线| 国产一区二区在| 欧美资源一区| 亚洲va国产| 日韩一区免费| 国产精品久久久久久久久久软件| 久久久综合亚洲91久久98| 国产高清精品一区| 国产乱子伦农村xxxx| 国产精品视频一区二区二| 午夜激情在线免费观看| 欧美精品日韩一区| 国产精品一二二区| 亚洲精品国产一区二区三区| 国产主播啪啪| 99精品小视频| 国产偷亚洲偷欧美偷精品| 99国产精品久久久久| 国产日韩欧美中文字幕| xoxoxo亚洲国产精品| 午夜国内精品a一区二区桃色| 丝袜美腿诱惑一区二区| 李采潭伦理bd播放| 97涩国一产精品久久久久久久| 国产三级在线视频一区二区三区 | 欧美69精品久久久久久不卡| 国产精品入口麻豆九色| 午夜一区二区三区在线观看| 在线播放国产一区| 国产一区二区免费在线| 国产品久精国精产拍| 日韩欧美高清一区| 久久99国产精品视频| 午夜电影一区二区三区| 88国产精品欧美一区二区三区三| 午夜天堂在线| 久久精品一| 久久久久久久国产精品视频| 午夜黄色一级电影| 午夜三级大片| 欧美激情综合在线| 国产一区观看| 中文字幕a一二三在线| 国产免费一区二区三区四区五区| 午夜av片| 国产一区日韩欧美| 亚洲精品无吗| 国产69精品久久久久按摩| 精品国产乱码一区二区三区在线| 亚洲欧美另类国产| 天天射欧美| 国产亚洲精品久久久久久网站| 亚洲精品国产主播一区| 制服丝袜亚洲一区| 国产欧美日韩一级大片| 亚洲欧洲一区| 国产欧美视频一区二区| 国产精品久久久不卡| 久久91久久久久麻豆精品| 狠狠插影院| 国产电影精品一区| 欧美高清性xxxx| 91性高湖久久久久久久久_久久99| 日韩一区二区中文字幕| 国产精品99999999| 亚洲va国产| 亚洲乱玛2021| 欧美在线视频精品| 午夜一级电影| 午夜亚洲国产理论片一二三四| 免费毛片**| 国产精品欧美久久久久一区二区| 狠狠色噜噜狠狠狠狠米奇777| 亚洲国产另类久久久精品性| 久久99精品国产99久久6男男 | 亚洲va久久久噜噜噜久久0| 精品国产1区2区| 日韩av中文字幕第一页| 午夜av男人的天堂| 亚洲国产精品第一区二区| 欧美黑人巨大久久久精品一区| 99国产精品9| 亚洲国产精品综合| 日本一二三区视频| 欧美精品日韩一区| 国产精品偷拍| 窝窝午夜理伦免费影院| 久久99国产综合精品| 97视频一区| 欧美一级特黄乱妇高清视频| 日韩精品免费一区二区三区| 国产女性无套免费看网站| 日韩亚洲精品在线观看| 欧美乱妇在线观看| 欧美日韩国产午夜| 国产视频精品久久| 欧美日韩三区二区| 日韩av在线导航| 久久精品视频3| 亚洲欧洲日韩在线| 538国产精品一区二区免费视频| 久久久久久久亚洲视频| 日本一区二区高清| 精品一区二区三区中文字幕| 国产日产欧美一区| 国产一级片自拍| 中文字幕一区一区三区| 国产中文字幕一区二区三区 | 91av中文字幕| 欧美一区二区三区久久精品视| 91亚洲欧美强伦三区麻豆| 欧美二区在线视频| 大伊人av| 黄毛片在线观看| 精品特级毛片| 美国一级片免费观看| 国久久久久久| 毛片大全免费观看| 国产精品综合在线| 亚洲精品中文字幕乱码三区91| 日本丰满岳妇伦3在线观看| free×性护士vidos欧美| 国产一区二区三区色噜噜小说| 午夜大片网| 91av精品| 亚洲精品卡一卡二| 亚洲一二三在线| 一本色道久久综合亚洲精品图片| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 电影91久久久| 欧美乱妇在线观看| 国产欧美二区| 欧美一区二区三区三州| 99热久久这里只精品国产www| 久久精品男人的天堂| 国产精品久久久久久av免费看| 欧美资源一区| 激情欧美一区二区三区| 国产精品午夜一区二区| 国产精品第157页| 亚洲久色影视| 日本一码二码三码视频| 日本精品一二三区| 国产精品自产拍在线观看桃花| 久久一区二区视频| 91精品第一页| 久久96国产精品久久99软件| 91麻豆精品国产综合久久久久久| 精品国产一区在线| 国产视频一区二区三区四区| 午夜影院啊啊啊| 久久99久国产精品黄毛片入口 | 97人人澡人人爽人人模亚洲 | 欧美久久一区二区三区| 91国内精品白嫩初高生| 亚洲国产精品美女| 国产88久久久国产精品免费二区| 欧美综合国产精品久久丁香| 国产精品视频久久| 国产在线不卡一| 激情久久一区二区| 日本久久丰满的少妇三区| 欧美一区二区三区免费观看视频| 国产亚洲精品久久777777| 色综合久久88| 日韩三区三区一区区欧69国产| 午夜一二区| 久久黄色精品视频| 91在线一区| 国产精品免费观看国产网曝瓜| 91精品一二区| 少妇高潮大叫喷水| 三级午夜片| 国产欧美精品一区二区三区小说| 国产一区二区日韩| 日韩av一区二区在线播放| 国产一区二区综合| 狠狠躁夜夜躁2020| 国产精品久久久久久久久久久久久久久久| 欧美精选一区二区三区| 午夜伦理片在线观看| 欧美精品粉嫩高潮一区二区| 国产亚洲久久| 欧美在线免费观看一区| 高清在线一区二区| 日韩精品午夜视频| 久久99精品国产麻豆宅宅| 国产精品电影免费观看| 国产日韩欧美精品| 婷婷嫩草国产精品一区二区三区| 日本一区二区三区电影免费观看| 国产91清纯白嫩初高中在线观看| 久久免费视频一区| 国产精品视频tv| 久久国产精久久精产国| 亚洲欧美精品suv| 一区精品二区国产| 国产亚洲精品久久久456| 国产精品国产三级国产专区55| 色狠狠色狠狠综合| 窝窝午夜精品一区二区| 国产精品偷伦一区二区| 国产精品日韩精品欧美精品| 午夜影院h| 国产一区二区三级| 欧美视频1区| 国产精品一区二区免费视频| 久久久久久国产一区二区三区| 日本高清不卡二区| 91久久免费|