日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于對手模型和迭代推理的策略識別與重用方法在審

專利信息
申請號: 202110323731.X 申請日: 2021-03-26
公開(公告)號: CN112884152A 公開(公告)日: 2021-06-01
發明(設計)人: 黃健;陳浩;韓潤海;劉權;龔建興;李嘉祥;鄧漢強 申請(專利權)人: 中國人民解放軍國防科技大學
主分類號: G06N5/04 分類號: G06N5/04
代理公司: 北京風雅頌專利代理有限公司 11403 代理人: 曾志鵬
地址: 410003 湖*** 國省代碼: 湖南;43
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 對手 模型 推理 策略 識別 重用 方法
【權利要求書】:

1.一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,包括離線學習階段和在線重用階段,所述離線學習階段通過強化學習算法得到對手當前策略的應對策略并用于構建策略庫,獲取對手當前行為數據構建對手模型,依托對手模型構建基于效用值的性能模型;所述在線重用階段獲取效用值和對手行為信息,通過迭代推理估計對手策略,調用所述策略庫中的應對策略進行重用。

2.根據權利要求1所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,在所述在線階段根據對手當前行為數據獲取回合內信念,根據回合內信念修正回合間信念,迭代推理估計對手的當前策略,調用所述策略庫中的應對策略進行重用。

3.根據權利要求1所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,所述學習算法為PPO學習算法,其中Actor的損失函數和Critic的損失函數分別為:

其中,CLIP為值域為[1-ε,1+ε]的截斷函數,∈∈(0,1),rt(θ)表示新舊策略的概率比,表示t時刻相對優勢函數的估計,θ為Actor的參數,θv為Critic的參數,表示智能體在狀態st的價值函數,γ∈(0,1)為折扣因子。

4.根據權利要求3所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,新舊策略的概率比為:

其中,為上一更新時刻的策略,πθ(at|st)為當前策略。

5.根據權利要求3所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,相對優勢函數的估計為:

其中,表示t時刻相對優勢函數的估計,rt'為從環境中獲得的獎勵。

6.根據權利要求1所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,對手模型的損失函數可以表示為:

其中,為對手在狀態si下執行動作oi的估計概率,ηe∈[0,1]為信息熵常數,在每回合結束時通過最小化損失函數更新對手模型的參數φ。

7.根據權利要求2所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,根據效用值和對手行為信息通過迭代推理估計對手策略的方式包括以下步驟:

離線學習階段,獲取回合內累積效用值并將其擬合為正態分布,構建性能模型;

在線重用階段,根據性能模型和累積效用值更新回合間信念;

根據對手行為信息和對手模型更新回合內信念;

結合回合內信念和回合間信念選擇最優應對策略。

8.根據權利要求7所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,智能體選擇應對策略的方式可以表示為:

其中,為在回合間信念β(τ)下能夠獲得的最優期望效用。

9.根據權利要求8所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,回合內信念的更新方式可以表示為:

其中,為τ的對手模型,k為當下回合的步數,定量描述了對手用策略τ生成的可能性,在每回合結束時,用最新的回合內信念ξ(τ)為回合間信念β(τ)賦值。

10.根據權利要求8所述的一種基于對手模型和迭代推理的策略識別與重用方法,其特征在于,根據即時信念實時調用所述策略庫中的應對策略進行重用,即時信念為:ζ(τ)=ρkβ(τ)+(1-ρk)ξ(τ)

其中,ρ∈(0,1)為常數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110323731.X/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲一区欧美| 日韩夜精品精品免费观看| 国产一区网址| 国产一区二区三区久久久| 小萝莉av| 中文字幕欧美久久日高清| 欧美日韩一区二区三区四区五区| 国产精品一级片在线观看| 久久婷婷国产综合一区二区| 精品99在线视频| 销魂美女一区二区| 99国产超薄丝袜足j在线观看| 国产精品免费自拍| 国产精品国产三级国产专播精品人 | 免费a级毛片18以上观看精品| 日韩精品免费一区二区中文字幕 | 一区二区欧美精品| 91国产在线看| 少妇久久精品一区二区夜夜嗨| 午夜欧美a级理论片915影院| 国产麻豆一区二区三区精品| 国模吧一区二区| 欧美乱妇在线观看| 欧美系列一区| 国产一区二区三级| 色婷婷综合久久久中文一区二区| www.成| 久久99久国产精品黄毛片入口| 国产伦理久久精品久久久久| 狠狠操很很干| 91国产一区二区| 国产精品影音先锋| 鲁丝一区二区三区免费| 中文字幕1区2区3区| 国模精品免费看久久久| 中文字幕国内精品| 999久久久国产| 欧美一级片一区| 久久久久国产精品免费免费搜索| 黑人巨大精品欧美黑寡妇| 少妇av一区二区三区| 国产伦高清一区二区三区| 99国产精品一区二区| 日本久久丰满的少妇三区| 日本高清二区| 国产精品无码永久免费888| 国产欧美一区二区三区在线播放| 色婷婷精品久久二区二区蜜臂av| 电影91久久久| 91麻豆精品国产综合久久久久久| 99爱精品视频| 高清国产一区二区| 国产99网站| 日韩欧美一区二区久久婷婷| 欧美在线视频一区二区三区| 欧美精品日韩一区| 日韩av在线一区| 亚洲国产精品女主播| 夜夜爽av福利精品导航| 国产精品久久久不卡| 狠狠色狠狠色综合久久第一次| 日本少妇一区二区三区| 精品国产一级| 日韩一区高清| 国产精品不卡在线| 精品国产精品亚洲一本大道| 国产精品香蕉在线的人| 精品国产乱码久久久久久久| 一区二区三区国产精华| 欧美日韩偷拍一区| 躁躁躁日日躁网站| 国产精品18久久久久白浆| 国产精品视频免费看人鲁| 国产精一区二区三区| 香港三日本三级三级三级| 国产视频二区| 欧美一区二区免费视频| 国产69精品久久| 日韩精品人成在线播放| 久久精品国产一区二区三区| 久久人人爽爽| xxxx18hd护士hd护士| 国产偷久久一区精品69| 日本一区二区三区电影免费观看| 午夜色影院| 国产视频一区二区不卡| 欧美一区二区三区日本| 国产91在线播放| 国产偷国产偷亚洲清高| 国产午夜精品免费一区二区三区视频 | 午夜国内精品a一区二区桃色| 国产精品九九九九九| 91亚洲精品国偷拍自产| 一区二区三区免费高清视频| 麻豆精品久久久| 欧美一区二区久久久| 欧美精品在线观看一区二区| 精品国产九九| 夜夜爽av福利精品导航| 国产日韩欧美一区二区在线播放| 欧美一区二区精品久久| 日韩午夜一区| 日韩女女同一区二区三区| 国产农村妇女精品一区二区 | 91精品免费观看| 国产精品理人伦一区二区三区 | 19videosex性欧美69| 久久国产中文字幕| 中文字幕一区二区三区免费| 亚洲第一天堂无码专区| 国产欧美日韩精品一区二区图片| 国产精品人人爽人人做av片| 欧美一区二区三区久久久| 天天干狠狠插| 国语对白老女人一级hd| 午夜片在线| 国产免费第一区| 国产精品中文字幕一区| 国产精品刺激对白麻豆99| 丝袜脚交一区二区| 一区二区三区电影在线观看| 国产欧美日韩精品在线| 日本美女视频一区二区三区| 午夜电影院理论片做爰| 日本大码bbw肉感高潮| 国产精品久久久久久亚洲调教| 欧美一级片一区| 欧美一区二区三区日本| 欧美亚洲精品suv一区| 久久国产精品欧美| 国产一区二区三区午夜| 欧美在线视频一区二区三区| 久爱视频精品| 国产精自产拍久久久久久蜜| 国产亚洲精品久久19p| 国产精品日产欧美久久久久| 99精品区| 国产精品视频久久久久| 精品国产乱码一区二区三区在线| 欧美日韩亚洲三区| 国产精品亚洲精品一区二区三区| 亚洲一区中文字幕| 99久久精品免费看国产免费粉嫩| 国产欧美日韩综合精品一| 国产日韩精品一区二区| 国产一二区在线| av中文字幕一区二区| 国产精自产拍久久久久久蜜| 亚洲精品性| 国产在线播放一区二区| 久久综合国产精品| 午夜精品一区二区三区三上悠亚 | 日本福利一区二区| 欧美一区二区久久久| 国产伦高清一区二区三区| 国模吧一区二区| 狠狠色丁香久久综合频道 | 国产精品色在线网站| 欧美日韩综合一区| 国产aⅴ精品久久久久久| 日韩av在线免费电影| 97久久精品一区二区三区观看| 国产伦精品一区二区三区免费迷| 亚洲欧美精品suv| 久久网站精品| 国产日韩欧美一区二区在线播放| 91狠狠操| 色婷婷噜噜久久国产精品12p| 国产精品一二三区免费| 国产欧美一区二区三区四区| 91一区二区在线观看| 国产香蕉97碰碰久久人人| 欧美老肥婆性猛交视频| 亚洲四区在线| 一区二区在线视频免费观看| 国产精品亚发布| 午夜av片| 少妇bbwbbwbbw高潮| 午夜免费av电影| 欧美三区二区一区| 99精品小视频| 日本一区免费视频| 蜜臀久久精品久久久用户群体| 狠狠躁夜夜躁2020| 在线观看国产91| 国产乱对白刺激在线视频| 国产一级自拍| 538在线一区二区精品国产 | 夜夜夜夜夜猛噜噜噜噜噜gg| 日本一二区视频| 国产精品久久久区三区天天噜| 日韩中文字幕亚洲欧美| 亚洲高清乱码午夜电影网| 国产精品一级在线| 色综合久久综合| 99精品国产一区二区三区麻豆| 91国内精品白嫩初高生| 538在线一区二区精品国产| 国产高清精品一区| 日韩精品一区在线观看| 香港三日本三级三级三级| 91人人爽人人爽人人精88v| 国模一区二区三区白浆| 亚洲国产精品一区在线| 伊人久久婷婷色综合98网| 欧美777精品久久久久网| 国产伦精品一区二区三| 欧美精品xxxxx| 97香蕉久久国产超碰青草软件 | 亚洲午夜国产一区99re久久| 国产麻豆一区二区三区在线观看| yy6080影院旧里番乳色吐息| 日韩精品免费播放| 久久精品爱爱视频| 国产一级片子| 国产色婷婷精品综合在线播放| 国产69精品久久久久app下载| 91波多野结衣| 一区二区三区欧美日韩| 96精品国产| 亚洲五码在线| 亚洲高清久久久| 国产国产精品久久久久| 999久久久国产| 日韩欧美视频一区二区| 狠狠色丁香久久综合频道日韩| 三级视频一区| 女人被爽到高潮呻吟免费看| 精品久久国产视频| 热re99久久精品国99热蜜月| 日韩一级片免费观看| 免费精品一区二区三区视频日产| 四虎影视亚洲精品国产原创优播| www.午夜av| 国产精彩视频一区二区| 99国产精品久久久久| 狠狠色狠狠色合久久伊人| 国产精品日韩一区二区三区| 国产婷婷色一区二区三区在线| 国产69精品99久久久久久宅男| 久久午夜精品福利一区二区| 久久夜色精品国产亚洲| 国产精品乱码一区| 国产91精品高清一区二区三区| 久久久久亚洲| 国产麻豆一区二区|