日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種在強化學習中基于變分自動編碼器的內部激勵方法在審

專利信息
申請號: 202310247094.1 申請日: 2023-03-15
公開(公告)號: CN116306816A 公開(公告)日: 2023-06-23
發明(設計)人: 曹俊豪;孔燕 申請(專利權)人: 南京信息工程大學
主分類號: G06N3/0464 分類號: G06N3/0464;G06N3/08
代理公司: 南京蘇高專利商標事務所(普通合伙) 32204 代理人: 柏尚春
地址: 210044 江蘇*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 強化 學習 基于 自動 編碼器 內部 激勵 方法
【說明書】:

發明公開了一種在強化學習中基于變分自動編碼器的內部激勵方法,通過構建Advantage?Actor?Critic(A2C)深度強化學習框架并采用變分自動編碼器(VAE)將狀態空間投射到一個潛在空間,該空間將表示環境的內在結構;通過使用VAE容易地得到智能體對于狀態好奇度的度量,并將其定義為在潛在空間上后驗分布偏離先驗分布的程度。本發明所述方法為探索與利用困境提供了一種新的思路,保留了以往方法的優越性,也引入了新思路的先進性,對于探索與利用問題具有重要的參考意義;本發明提出的使用變分自動編碼對狀態進行編碼,對于何時進行探索何時進行利用進行了合理的設計,對于探索與利用這一經典問題具有重要的研究意義。

技術領域

本發明涉及強化學習與探索和利用問題,特別是一種在強化學習中基于變分自動編碼器的內部激勵方法。

背景技術

對于探索和利用何如平衡這個問題一直備受關注。在探索和利用之間不取得一個較好的平衡容易使智能體陷入局部最優。當智能體陷入局部最優策略,它只會注重眼前的獎勵而忽略更大的獎勵,會做出許多令人荒誕的決策,最終使得累計獎勵無法最大化。近年來越來越多的學者致力于解決這一問題。

對于傳統的ε-greedy方法的改進,比如Tokic等提出了基于值差異的自適應ε-greedy方法(VDBE),該方法通過控制與狀態相關的探索概率ε來擴展ε-greedy方法。在這項工作中,在智能體每次學習后使用基于價值函數估計的玻爾茲曼分布式方程獲得新的ε值。Alexandre等提出了一種自適應ε-greedy方法。該方法使用自適應技術的概念,通過判斷當前最高平均獎勵和以前最高平均獎勵之間的差異,并對差異進行數值正則化,最后判斷是否更新ε的值。

對于基于內在獎勵的算法,比如Bellemare等提出了基于計數的探索模型。該模型借鑒了UCB方法的思想,對每個狀態進行虛擬計數。為了鼓勵智能體獲得更高的獎勵,當智能體探索到新穎狀態時給予較高的內在獎勵,反之則給予較低的內在獎勵?;谏鲜瞿P?,Ostrovski等提出了基于計數的神經密度模型。該模型結合了PixelCNN模型證明密度模型的質量對探索的重要性,顯著的提高了算法性能。再比如Pathak等人提出了自我監督預測的好奇心驅動探索。該方法使用自監督的反向動態模型學習狀態空間編碼,通過反向動態模型捕獲智能體動作的狀態特征,利用當前狀態和下一個狀態特征進行計算并把狀態之差作為內在獎勵驅動智能體進行探索。Open?AI團隊的Burda等提出隨機網絡蒸餾,該工作靈活地結合了內部和外部獎勵。該方法使智能體在艱難探索的問題中取得了良好的表現。

發明內容

發明目的:本發明的目的是提供一種在強化學習中基于變分自動編碼器的內部激勵方法,從而解決傳統算法不能適用于高維狀態空間的問題。

技術方案:本發明所述的一種在強化學習中基于變分自動編碼器的內部激勵方法,包括以下步驟:

(1)對穿越熔巖迷宮環境信息進行預處理;

(2)利用Advantage?Actor-Critic構建深度強化學習框架;

(3)將狀態數據集輸入變分自動編碼器得到智能體對于狀態好奇度的度量,并將其定義為在潛在空間上后驗分布偏離先驗分布的程度;

(4)每經過N個時間步,訓練actor網絡和critic網絡,并返回累計獎勵Gt

(5)在數據集D中,對被收集的狀態s上訓練變分自動編碼器;

(6)重新初始化數據集D,將狀態st插入數據集D中。并在MiniGrid平臺上進行可視化展示。

所述步驟(1)具體為:

采集智能體在迷宮中的初始觀測值和初始狀態s0,形成數據集D。

所述步驟(2)具體為:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310247094.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 狠狠色狠狠色综合日日2019| 日韩一区免费| 国产69精品久久| 久久中文一区二区| 国产视频二区在线观看| 欧美精品一区二区久久| 国产剧情在线观看一区二区| 999偷拍精品视频| 免费在线观看国产精品| 久久两性视频| xoxoxo亚洲国产精品| 一本大道久久a久久精品| 国产一区二区三区四区五区七| 丰满少妇高潮惨叫久久久| 视频一区二区中文字幕| 国产大片黄在线观看私人影院| 一区二区在线视频免费观看| 欧美在线一区二区视频| 国产一a在一片一级在一片| 国产乱对白刺激视频在线观看 | 久久久久久久久久国产精品| 狠狠色噜噜狠狠狠狠2018| 国产精品自产拍在线观看蜜| 国产精品久久免费视频在线| 亚洲理论影院| 国产欧美一区二区精品性| 国产一二区在线| 欧美极品少妇videossex| 国产精品一区在线播放| 一区二区不卡在线| 亚洲一二区在线观看| 精品少妇一区二区三区免费观看焕| 国产亚洲精品久久久久久网站| 午夜剧场伦理| 午夜亚洲影院| 日本五十熟hd丰满| 中文字幕制服丝袜一区二区三区| 91看黄网站| 日韩精品免费看| 国产91免费在线| 中文字幕制服狠久久日韩二区| 欧美一区二区三区四区夜夜大片 | 日韩欧美国产第一页| 国产在线一卡二卡| 国产一区日韩欧美| 国产999精品久久久久久绿帽| 91精品一区二区在线观看| 久久99国产视频| 综合在线一区| 91麻豆精品国产91久久久更新资源速度超快 | 午夜影院伦理片| 一区二区不卡在线| 亚洲精品色婷婷| 亚洲三区二区一区| 国产区图片区一区二区三区| 激情久久久久久| 日本不卡精品| 久久久一二区| 国产在线一卡二卡| 精品美女一区二区三区| 中文字幕一区二区三区不卡| 偷拍久久精品视频| 亚洲欧美国产一区二区三区| 99精品一区| 一区二区三区欧美在线| 欧美hdfree性xxxx| 少妇中文字幕乱码亚洲影视| 国产日韩欧美在线影视| 国产一区影院| 欧美777精品久久久久网| 午夜天堂电影| 91麻豆精品国产自产欧美一级在线观看| 91偷拍网站| 欧美日韩卡一卡二| 久久精品一二三| 99久久精品国产国产毛片小说| 日本一区二区电影在线观看| 国产一级片网站| 亚洲精品乱码久久久久久按摩| 伊人精品一区二区三区| 国产99久久久国产精品免费看| 亚洲精品国产setv| 亚州精品中文| 国产在线不卡一区| xxxx国产一二三区xxxx| 免费看性生活片| 久久二区视频| 国产一区三区四区| 国产乱人乱精一区二视频国产精品 | 亚洲va久久久噜噜噜久久0| 日韩毛片一区| 狠狠色噜噜狠狠狠狠黑人| 国产精品99999999| 欧美日韩一级在线观看| 日本精品99| 国产在线拍偷自揄拍视频| 欧美一区二区三区免费看| 久久黄色精品视频| 亚洲国产精品美女| 国产精品一区二区在线看| 性视频一区二区三区| 国产一区二区高潮| 日韩久久精品一区二区三区| 欧美日韩精品影院| 久久久久国产精品嫩草影院| 欧美激情视频一区二区三区| 中文字幕日韩有码| 中文字幕在线乱码不卡二区区| 国产资源一区二区| 亚洲五码在线| 国产一二区精品| 欧美一级日韩一级| 亚洲精品国产suv| 久久久精品欧美一区二区免费| 中文字幕一区二区三区免费| 久久精品国产一区二区三区不卡| 国产精品久久二区| 午夜av电影网| 伊人av综合网| 日韩一级视频在线| 久久精品二| 午夜社区在线观看| 国产91九色在线播放| av午夜电影| 91午夜在线观看| 狠狠躁夜夜躁2020| 强制中出し~大桥未久10在线播放| 久久人91精品久久久久久不卡| 国产精品一区在线观看你懂的 | 欧美日韩国产专区| 欧美乱大交xxxxx| 国产一区二区精品在线| 中文字幕欧美日韩一区| 蜜臀久久精品久久久用户群体| 亚洲一二三在线| 久久夜色精品久久噜噜亚| 99久久婷婷国产综合精品电影 | 国产大片黄在线观看私人影院| 97视频精品一二区ai换脸| 日韩精品久久久久久久酒店| 99精品视频一区二区| 日日噜噜夜夜狠狠| 国产欧美一区二区三区免费看| 99国产精品永久免费视频| 日本精品一二三区| 国产97在线播放| 国产视频一区二区不卡| 亚洲欧美另类国产| 国产精品久久久久久亚洲调教| 午夜影院毛片| 亚洲乱玛2021| 国产不卡网站| 久久国产精彩视频| 鲁一鲁一鲁一鲁一鲁一av| 91国产一区二区| 公乱妇hd在线播放bd| 91午夜在线| 午夜伦全在线观看| 日本一区二区三区在线看| 国产91高清| 国产精品中文字幕一区二区三区| 午夜看片在线| 性old老妇做受| 日韩偷拍精品| 国产精品综合在线| 国产一二区精品| 国产精品自拍不卡| 欧美精品一区二区三区在线四季| 夜夜精品视频一区二区| 欧美日韩国产123| 亚洲精品国产91| 亚洲午夜国产一区99re久久| 欧美一区二区三区艳史| 中文在线√天堂| 99久久国产综合精品麻豆| 蜜臀久久99精品久久一区二区| 久久精品麻豆| 7799国产精品久久99| 日韩精品一区二区三区免费观看| 欧美久久精品一级c片| 亚洲乱码av一区二区三区中文在线:| 国产白丝一区二区三区| 欧美日韩一级黄| 狠狠色噜噜狠狠狠狠黑人| 亚洲精品一品区二品区三品区| 久久两性视频| 国产精品综合一区二区三区| 99re6国产露脸精品视频网站| 99热久久精品免费精品| 国产精品美乳在线观看| 国产呻吟久久久久久久92| 欧美激情视频一区二区三区免费| 91精品国产综合久久福利软件| 午夜精品一二三区| 国产91电影在线观看| 17c国产精品一区二区| 日本高清二区| 国产乱人伦精品一区二区| 国偷自产中文字幕亚洲手机在线| 国产99视频精品免视看芒果| 日本免费电影一区二区| 久久99久久99精品蜜柚传媒| 激情久久影院| 日日噜噜夜夜狠狠| 国产69久久| 国产在线欧美在线| 亚洲麻豆一区| 日韩av免费电影| 久久国产精品99国产精| 美女脱免费看直播| 日韩一级片免费视频| 91久久精品国产亚洲a∨麻豆 | 综合国产一区| 欧美视频1区| 美日韩一区| 久久福利视频网| 少妇高潮一区二区三区99小说| 日日噜噜夜夜狠狠| 处破大全欧美破苞二十三| 日本三级香港三级| 欧美在线视频三区| 欧美乱妇高清无乱码免费| 国产日韩欧美中文字幕| 国产日韩欧美精品| 国产精品免费不卡| 午夜无遮挡| 欧美精品九九| 国产偷窥片| 国产偷久久一区精品69| 久久婷婷国产香蕉| 国产乱人伦精品一区二区| 国产日韩欧美一区二区在线观看| 91精品国产高清一二三四区| 99国产精品免费| 日韩欧美视频一区二区| 日本99精品| 国产一区在线精品| 国产欧美一区二区三区四区| 日韩精品一区二区中文字幕| 91精品国产综合久久福利软件| 狠狠躁夜夜躁2020| 人人要人人澡人人爽人人dvd| 91性高湖久久久久久久久_久久99| 国产欧美一区二区三区沐欲| 午夜欧美影院| 欧美一区二区三区黄|