日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于好奇心機制的Rainbow智能體訓練方法在審

專利信息
申請?zhí)枺?/td> 202210903501.5 申請日: 2022-07-28
公開(公告)號: CN115293361A 公開(公告)日: 2022-11-04
發(fā)明(設(shè)計)人: 高天寒;朱珈慧;劉藝儒 申請(專利權(quán))人: 東北大學
主分類號: G06N20/00 分類號: G06N20/00;G06N3/04;G06N3/08
代理公司: 沈陽東大知識產(chǎn)權(quán)代理有限公司 21109 代理人: 李珉
地址: 110819 遼寧*** 國省代碼: 遼寧;21
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 好奇心 機制 rainbow 智能 訓練 方法
【說明書】:

發(fā)明提供一種基于好奇心機制的Rainbow智能體訓練方法,涉及深度強化學習技術(shù)領(lǐng)域。該方法首先將Rainbow智能體訓練的時間差分法TD的一步自舉換成多步自舉,并構(gòu)造Rainbow智能體訓練的目標函數(shù);再定義Rainbow智能體訓練的多步損失函數(shù),將通過多步自舉得到的損失與雙Q網(wǎng)絡結(jié)合,并使用目標函數(shù)評估智能體不同價值下的動作;然后改變Rainbow智能體訓練時的優(yōu)先體驗重放順序;將DuelingDQN與分布式網(wǎng)絡結(jié)合作為Rainbow智能體網(wǎng)絡,對Rainbow智能體的網(wǎng)絡體系結(jié)構(gòu)進行調(diào)整;最后設(shè)計好奇心模塊,在Rainbow智能體訓練中添加好奇心機制,計算好奇心模塊中前向動力學模型預測誤差,并將其作為智能體訓練的內(nèi)在獎勵,使智能體不斷去探索新的狀態(tài)。

技術(shù)領(lǐng)域

本發(fā)明涉及深度強化學習技術(shù)領(lǐng)域,尤其涉及一種基于好奇心機制的Rainbow智能體訓練方法。

背景技術(shù)

深度強化學習是深度學習與強化學習的結(jié)合。深度學習具有較強的感知能力,但是缺乏一定的決策能力;而強化學習具有決策能力,對感知問題束手無策。深度學習是學習樣本數(shù)據(jù)的內(nèi)在規(guī)律和表現(xiàn)層次,它的最終目標是機器能夠像人一樣具有分析學習能力,能夠識別文字、圖像和聲音等數(shù)據(jù)。強化學習是機器學習的一個分支,它最大的特點就是在交互中學習,智能體在與環(huán)境的交互中根據(jù)獲得的獎勵或懲罰不斷地學習。兩者優(yōu)勢互補,為復雜系統(tǒng)的感知決策問題提供了解決思路。

智能體訓練就是將學習看作是一個試探過程。智能體在環(huán)境中獲取狀態(tài),之后利用該狀態(tài)選擇一個動作,一個決策。環(huán)境接受該決策之后,就會輸出下一個狀態(tài)以及當前決策所得到的獎勵。選擇的決策不僅會影響當前的獎勵,還會影響下一次的狀態(tài)和最終的獎勵。智能體的目的就是在環(huán)境中盡可能獲得最大的獎勵。

深度Q學習網(wǎng)絡(Deep Q Network,即DQN),作為深度強化學習的開山之作,DeepMind首次提出了深度強化學習這一概念,并且提出了DQN算法。他們首次將深度神經(jīng)網(wǎng)絡與強化學習進行了結(jié)合,實現(xiàn)從感知到動作的端到端學習,在多種Atari游戲中達到了超人的水平,深度強化學習從此成為深度學習領(lǐng)域的前沿研究方向。但傳統(tǒng)的DQN算法還存在著諸多問題,例如:目標Q值會被過高估計;不同樣本的重要性不同,隨機采樣方式未必完全適用;卷積神經(jīng)網(wǎng)絡的結(jié)構(gòu)存在局限性;DQN訓練效率太慢等問題。

除此之外,強化學習還依賴于精心設(shè)計的外部環(huán)境獎勵,人工設(shè)計的密集獎勵對于任意環(huán)境來說是無法擴展的。但實際中,智能體的外部獎勵是及其稀疏且容易錯過的,因為只有當智能體在成功達到預先制定的目標狀態(tài)時才會收到更新的強化策略。當外部獎勵很少時,智能體盲目的探索會導致大量時間資源的消耗,從而導致訓練效率的低下。

發(fā)明內(nèi)容

本發(fā)明要解決的技術(shù)問題是針對上述現(xiàn)有技術(shù)的不足,提供一種基于好奇心機制的Rainbow智能體訓練方法,實現(xiàn)對智能體的訓練。

為解決上述技術(shù)問題,本發(fā)明所采取的技術(shù)方案是:基于好奇心機制的Rainbow智能體訓練方法,

將Rainbow智能體訓練的時間差分法TD的一步自舉換成多步自舉,構(gòu)造Rainbow智能體訓練的目標函數(shù);

定義Rainbow智能體訓練的多步損失函數(shù);將通過多步自舉得到的損失與雙Q網(wǎng)絡結(jié)合,并使用目標函數(shù)評估智能體不同價值下的動作;

改變Rainbow智能體訓練時的優(yōu)先體驗重放順序;

將Dueling DQN與分布式網(wǎng)絡結(jié)合作為Rainbow智能體網(wǎng)絡,對Rainbow智能體的網(wǎng)絡體系結(jié)構(gòu)進行調(diào)整;

設(shè)計好奇心模塊,Rainbow智能體訓練中添加好奇心機制;

計算好奇心模塊中前向動力學模型預測誤差,并將其作為智能體訓練的內(nèi)在獎勵,使智能體不斷去探索新的狀態(tài);

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學,未經(jīng)東北大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210903501.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品久久久久久久岛一牛影视| 91婷婷精品国产综合久久| 最新国产精品自拍| 麻豆精品久久久| 狠狠躁日日躁狂躁夜夜躁av| 国产精品久久久久久久新郎| 午夜影院啊啊啊| 免费看欧美中韩毛片影院| 国产在线一区二区视频| 26uuu亚洲国产精品| 久久一区二区三区视频| 国产精品区一区二区三| 一区二区免费在线观看| 国产精品69久久久| 中文字幕一区二区三区免费| 最新国产精品自拍| 国产视频一区二区三区四区| 一区二区三区精品国产| 国产91高清| 亚洲欧美另类久久久精品2019| 欧美日韩国产专区| 欧美二区精品| 久久久久久久国产精品视频| 国产精品中文字幕一区二区三区| 中文乱码字幕永久永久电影| 久久九精品| 一区二区三区国产精品| 男女无遮挡xx00动态图120秒| 国产欧美精品va在线观看| 精品少妇的一区二区三区四区| 精品国产一区二区三区麻豆免费观看完整版 | 麻豆国产一区二区| 国产午夜精品一区理论片飘花| 日本一二三不卡| 91热精品| 中文字幕日韩有码| 国产精品午夜一区二区| 亚洲国产精品97久久无色| 日本午夜影视| 精品国产一区二区三区国产馆杂枝| 欧美在线免费观看一区| 一区二区三区精品国产| 国产又色又爽无遮挡免费动态图| 亚洲欧美另类国产| 狠狠色丁香久久婷婷综合丁香| 国产精品视频二区三区| 免费在线观看国产精品| 亚洲欧美v国产一区二区| 久久国产精品99国产精| 蜜臀久久99静品久久久久久| 亚洲精品国产久| 国产精品免费一区二区区| 97精品国产aⅴ7777| 激情久久一区二区| 人人要人人澡人人爽人人dvd| 欧美精品一区二区三区久久久竹菊| 麻豆91在线| 午夜色大片| 美女销魂免费一区二区| 精品在线观看一区二区| 狠狠色噜噜狠狠狠狠色综合久老司机| 国产人伦精品一区二区三区| 91超碰caoporm国产香蕉| 午夜肉伦伦| 国产99久久九九精品| 真实的国产乱xxxx在线91| 亚洲伊人久久影院| 精品少妇一区二区三区免费观看焕 | 日韩精品一区二区中文字幕| 午夜a电影| 精品少妇一区二区三区免费观看焕 | 日本一区二区三区在线看 | xxxxx色| 国产原创一区二区| 久久久久国产精品www| 99精品偷拍视频一区二区三区| 欧美资源一区| 国产精品视频免费一区二区| 亚洲精品久久久久一区二区 | 国产一区2区3区| 69久久夜色精品国产69–| 91精品国产综合久久国产大片 | 丰满岳妇伦4在线观看| 国产精品视频二区不卡| 国产高清在线一区| 中文av一区| 欧美精品在线观看视频| 香港日本韩国三级少妇在线观看| 国产精品不卡一区二区三区| 国产精品色婷婷99久久精品| 欧美精品一区免费| 国产一区二区三区伦理| 日韩午夜电影在线| 强行挺进女警紧窄湿润| 99精品欧美一区二区三区美图| 欧美极品少妇| 国产精彩视频一区二区| 国产免费一区二区三区四区五区 | 精品国产乱码久久久久久老虎| 香蕉av一区二区三区| 国产99视频精品免费视频7| 91高清一区| 日韩欧美激情| 97久久超碰国产精品| 国产在线不卡一区| 精品国产一区二区三| 日本xxxx护士高潮hd| 国产日韩欧美亚洲| 国产精品自拍不卡| 久久午夜鲁丝片| 国产一区二区三区午夜| 高清欧美xxxx| 色噜噜狠狠一区二区| 日本一区二区免费电影| 4399午夜理伦免费播放大全| 蜜臀久久99精品久久久| 午夜理伦影院| 国产aⅴ精品久久久久久| 自拍偷在线精品自拍偷无码专区 | 国产天堂第一区| 国产午夜亚洲精品羞羞网站| 国产精品高潮在线| 欧洲在线一区二区| 久久精品一二三四| 91久久香蕉| 99久久夜色精品国产网站| 免费看性生活片| 午夜伦全在线观看| 在线观看国产91| 久久精品爱爱视频| 欧美日韩一区视频| 国产午夜一区二区三区| 国产欧美精品久久| 国产日韩欧美在线影视| 日本xxxxxxxxx68护士 | 国产日韩精品一区二区三区| 69久久夜色精品国产69乱青草| 欧美激情在线观看一区| 欧美在线视频三区| 又黄又爽又刺激久久久久亚洲精品| 色一情一乱一乱一区99av白浆| 毛片大全免费观看| 国产精品久久久久久久久久不蜜月| 国产91在线播放| 国产欧美一区二区精品久久久| 97人人澡人人添人人爽超碰| 亚洲国产欧美国产综合一区| 狠狠躁夜夜躁人人爽天天天天97 | 国产日产欧美一区二区| 一级午夜影院| 日韩av在线影院| 日本福利一区二区| 免费a一毛片| 88国产精品视频一区二区三区| 国产伦理精品一区二区三区观看体验 | 日韩精品免费一区二区在线观看| 欧美精品在线不卡| ass美女的沟沟pics| 91久久精品国产91久久性色tv| 国产精品国产三级国产专区55| 97人人模人人爽视频一区二区| 国产91福利视频| 性欧美1819sex性高播放| 国产精品一区二区久久乐夜夜嗨 | 日韩精品免费一区二区在线观看| 国产午夜精品一区二区三区四区| 中文字幕一区二区三区日韩精品| 国模少妇一区二区三区| 日本精品在线一区| 国产69精品久久久久久久久久| 日韩精品久久久久久中文字幕8| 一区二区三区欧美视频| 日本xxxxxxxxx68护士| 欧美一区二区三区四区五区六区| 欧美精品在线一区二区| 日韩毛片一区| 亚洲国产精品一区在线| 午夜国产一区二区三区| 欧美一区二区三区免费观看视频 | 97人人澡人人添人人爽超碰| 亚洲少妇一区二区| 亚洲色欲色欲www| 99国产精品免费| 国产大片黄在线观看私人影院 | 性国产videofree极品| 中文字幕久久精品一区| 免费欧美一级视频| 精品国产仑片一区二区三区| 玖玖国产精品视频| 国产大学生呻吟对白精彩在线| 亚洲精品www久久久久久广东| 久久久久久久久亚洲精品| 免费观看又色又爽又刺激的视频| 玖玖精品国产| 日韩精品1区2区3区| 国产午夜精品免费一区二区三区视频| 国产69精品久久| 国产视频精品一区二区三区 | 亚洲精品一区二区另类图片| 日韩精品少妇一区二区在线看| 日韩欧美多p乱免费视频| 精品国产乱码久久久久久久久| xxxx国产一二三区xxxx| 91看黄网站| 欧美高清性xxxxhd| 99三级视频| 欧美福利一区二区| 国产乱人乱精一区二视频国产精品 | 又黄又爽又刺激久久久久亚洲精品| 狠狠色狠狠色综合系列| 国产精品第157页| 国产白嫩美女在线观看| 黄毛片在线观看| 精品国产鲁一鲁一区二区作者 | 日本一二区视频| 国产高清在线一区| 亚洲福利视频一区| 欧美一区久久| 大bbw大bbw巨大bbb| 香港日本韩国三级少妇在线观看| 狠狠色狠狠色88综合日日91 | 国产69精品久久久久999天美| 猛男大粗猛爽h男人味| 免费午夜在线视频| 国产清纯白嫩初高生在线观看性色| 欧美精品日韩精品| 好吊色欧美一区二区三区视频| 国产精品电影免费观看| 国产九九影院| 国产高清在线观看一区| 国产一区欧美一区| 国91精品久久久久9999不卡| 搡少妇在线视频中文字幕| 欧美午夜羞羞羞免费视频app| 日本一区二区在线电影| 欧美色综合天天久久综合精品| 久久久久久综合网| 国产女人与拘做受免费视频| 99精品久久99久久久久| 91精彩刺激对白露脸偷拍| 一区二区三区在线观看国产| 久久91精品国产91久久久| 久久精品com| 扒丝袜pisiwa久久久久| 年轻bbwwbbww高潮| 欧美二区在线视频|