日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于好奇心機制的Rainbow智能體訓練方法在審

專利信息
申請號: 202210903501.5 申請日: 2022-07-28
公開(公告)號: CN115293361A 公開(公告)日: 2022-11-04
發明(設計)人: 高天寒;朱珈慧;劉藝儒 申請(專利權)人: 東北大學
主分類號: G06N20/00 分類號: G06N20/00;G06N3/04;G06N3/08
代理公司: 沈陽東大知識產權代理有限公司 21109 代理人: 李珉
地址: 110819 遼寧*** 國省代碼: 遼寧;21
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 好奇心 機制 rainbow 智能 訓練 方法
【權利要求書】:

1.一種基于好奇心機制的Rainbow智能體訓練方法,其特征在于:

將Rainbow智能體訓練的時間差分法TD的一步自舉換成多步自舉,構造Rainbow智能體訓練的目標函數;

定義Rainbow智能體訓練的多步損失函數;將通過多步自舉得到的損失與雙Q網絡結合,并使用目標函數評估智能體不同價值下的動作;

改變Rainbow智能體訓練時的優先體驗重放順序;

將DuelingDQN與分布式網絡結合作為Rainbow智能體網絡,對Rainbow智能體的網絡體系結構進行調整;

設計好奇心模塊,Rainbow智能體訓練中添加好奇心機制;

計算好奇心模塊中前向動力學模型預測誤差,并將其作為智能體訓練的內在獎勵,使智能體不斷去探索新的狀態。

2.根據權利要求1所述基于好奇心機制的Rainbow智能體訓練方法,其特征在于:

所述將Rainbow智能體訓練的時間差分法TD的一步自舉換成多步自舉,構造Rainbow智能體訓練的目標函數的具體方法為:

首先將Rainbow智能體訓練的時間差分法TD的一步自舉換成多步自舉,在時間差分的第零步TD(0)后進行多步采樣多步自舉;再通過將智能體的價值分布壓縮到第n步的價值St+n,并通過截取的n步折扣獎勵來構造智能體的目標函數。

3.根據權利要求2所述基于好奇心機制的Rainbow智能體訓練方法,其特征在于:所述構造Rainbow智能體訓練的目標函數如下公式所示:

其中,為t時刻內時間差分第n步的目標函數;z是智能體離散價值分布的支撐,其是原子atoms的集合;為截取的n步獎勵;為截取的n步折扣因子;表示在價值St+n時得到的動作對應的原子的概率。

4.根據權利要求2所述的基于好奇心機制的Rainbow智能體訓練方法,其特征在于:所述定義Rainbow智能體訓練的多步損失函數具體為:

使用KL散度去衡量兩個價值分布之間的距離,確定Rainbow智能體訓練的損失函數如下公式所示:

其中,DKL表示價值分布下的KL散度;dt為t時刻的目標函數;Φz為在智能體離散價值分布的支撐z上的投影。

5.根據權利要求4所述的基于好奇心機制的Rainbow智能體訓練方法,其特征在于:所述改變Rainbow智能體訓練時的優先體驗重放順序,具體為:

將所有智能體經驗樣本都根據KL散度計算出的損失來確定經驗的優先排序。

6.根據權利要求1所述的基于好奇心機制的Rainbow智能體訓練方法,其特征在于:所述將Dueling DQN與分布式網絡結合作為Rainbow智能體網絡,對Rainbow智能體的網絡體系結構進行調整,具體為:

分布式網絡使用參數化的離散分布來建立價值分布模型,分布的支撐是N個原子atoms的集合;在Rainbow智能體網絡中,價值流vη與優勢流aψ共享一個公共的卷積神經學習模塊fξ(s);設定Rainbow智能體網絡中卷積層的輸出是φ,則價值流vη的輸出是一個N維的向量Natoms,優勢流aψ的輸出是一個N×|A|的矩陣,A=Natoms×Nactions,Nactions表示分布式網絡輸出的矩陣有N行動作a,得到每個原子atoms所對應的狀態和動作概率如下公式所示:

其中,φ=fξ(s),表示對應于第m個原子的動作a的輸出,a′為狀態s所對應的動作,m=1,2,…,N;

最后將Rainbow智能體神經網絡中的所有線性層中的參數換成帶有分解的高斯噪聲的參數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210903501.5/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲精品国产主播一区| 国产第一区二区| 欧美视屏一区二区| 久久精品手机视频| 91精品色| 亚洲精品久久久久中文字幕欢迎你| 国产精品69久久久| 欧美亚洲国产日韩| 国产精品高潮呻吟久| 亚洲女人av久久天堂| 国产一级片一区| 国产在线卡一卡二| 欧美日韩三区二区| 毛片免费看看| 免费a一毛片| 强制中出し~大桥未久10在线播放| 日韩久久精品一区二区| 亚洲激情中文字幕| 亚洲精品一区,精品二区| 欧美日韩国产精品一区二区| 国产精品一区二区三区在线看| 国产精品自拍在线| 99精品小视频| 午夜电影一区| 日韩国产精品一区二区| 亚洲国产精品美女| 免费午夜片| 久久久精品二区| 在线播放国产一区| 亚洲欧美日本一区二区三区| 国产亚洲另类久久久精品| 96国产精品视频| 91一区二区三区在线| 玖玖精品国产| 精品少妇一区二区三区免费观看焕 | 亚洲国产精品一区在线| 亚洲欧美v国产一区二区| 日本一区二区三区免费视频| 欧美一区二三区人人喊爽| 免费看大黄毛片全集免费| 欧美在线观看视频一区二区三区 | 亚洲欧洲国产伦综合| 狠狠色综合久久丁香婷婷| 欧美一区二区综合| 国产精品三级久久久久久电影| 国产女人与拘做受免费视频| 久久久久久亚洲精品| 亚洲精品久久久久中文第一暮| 国产欧美日韩在线观看| 国产精品1区2区| 97精品国产97久久久久久| 欧美一区二区三区白人| 久久午夜鲁丝片午夜精品| 日韩精品在线一区二区三区| 91精品国产九九九久久久亚洲| 香蕉视频一区二区三区| 香港三日三级少妇三级99| 欧美午夜理伦三级在线观看偷窥| 日本五十熟hd丰满| 国产精品自产拍在线观看蜜| 亚洲精品卡一卡二| 国产的欧美一区二区三区| 狠狠色狠狠综合久久| 国产精品999久久久| 免费精品一区二区三区第35| 久久黄色精品视频| 国产精品久久免费视频| 欧美亚洲国产日韩| 精品国产一区二区三区麻豆免费观看完整版 | 一二三区欧美| 国产人澡人澡澡澡人碰视| 91国产在线看| 69久久夜色精品国产69–| 国内久久精品视频| 亚洲欧洲日韩在线| 91精品资源| 理论片高清免费理伦片| 午夜一级电影| 日韩午夜三级| 亚洲精品丝袜| 婷婷午夜影院| 69xx国产| 国产在线不卡一区| 久久99精品久久久久婷婷暖91| 四虎国产永久在线精品| 狠狠色噜噜狠狠狠狠黑人| 好吊色欧美一区二区三区视频| 国产麻豆精品一区二区| av中文字幕一区二区| 99国产精品久久久久老师| 曰韩av在线| 国产一二区精品| 狠狠色综合久久婷婷色天使| 久久99精品国产99久久6男男| 日韩欧美视频一区二区| 国产视频一区二区三区四区| 国产欧美精品一区二区三区小说| 亚洲欧美日韩一级| 日韩欧美中文字幕精品| 女人被爽到高潮呻吟免费看| 国产乱一乱二乱三| 日韩欧美一区二区在线视频| 少妇自拍一区| 欧美激情视频一区二区三区免费| 精品久久久久久久免费看女人毛片| 欧美网站一区二区三区| 国产一级二级在线| 午夜性电影| 国产精品一卡二卡在线观看| 毛片大全免费观看| 日韩精品中文字幕在线| 一区二区中文字幕在线| 久久密av| 欧美日韩久久一区| 香港三日本8a三级少妇三级99 | 日韩av在线影院| 日韩精品一区二区久久| 欧美一区二区三区三州| 国产特级淫片免费看| 久精品国产| 国产91一区二区在线观看| 亚洲国产精品国自产拍av| 91精品国产91热久久久做人人| 日本一区中文字幕| 国产一区欧美一区| 亚洲视频精品一区| 性刺激久久久久久久久九色| 999偷拍精品视频| 片毛片免费看| 肥大bbwbbwbbw高潮| 国产一区二区在线观| 亚洲制服丝袜在线| 欧美日韩国产精品一区二区| 浪潮av色| 理论片高清免费理伦片| 欧美一区二区三区久久精品| 91久久国产露脸精品国产| 国产不卡三区| 99re久久精品国产| 91精品国产麻豆国产自产在线| 国产午夜伦理片| 欧美在线一级va免费观看| 亚洲天堂国产精品| 国产精品国外精品| 国产一级大片| 日韩av在线一区| 91精品国产麻豆国产自产在线| 国产一区二区视频播放| 国产精品久久久久久久妇女| 女女百合互慰av| 国产精品亚洲第一区| 日韩毛片一区| 日韩国产不卡| 夜色av网| 岛国精品一区二区| 私人影院av| 91精品国产综合久久国产大片| 欧美精品第1页| 欧美日韩久久一区| 国产精品日本一区二区不卡视频| 中文字幕一级二级三级| 免费精品99久久国产综合精品应用| 国产欧美一区二区三区沐欲| 亚洲免费永久精品国产| 美女被羞羞网站视频软件| 国产精品香蕉在线的人| 日韩偷拍精品| 色婷婷综合久久久中文一区二区| 午夜电影一区二区三区| 狠狠色狠狠色合久久伊人| 国产日韩欧美另类| 国产精品免费一视频区二区三区 | 99国产超薄丝袜足j在线观看| 99久久夜色精品| 91国产在线看| 国产日韩欧美三级| 国产品久精国精产拍| 日韩亚洲欧美一区二区| 国产人澡人澡澡澡人碰视| 国产精品电影免费观看| 欧美69精品久久久久久不卡| 亚洲一二三在线| 日韩精品免费一区二区中文字幕 | 国产精品久久久爽爽爽麻豆色哟哟| 91精品一区| 午夜电影理伦片2023在线观看| 狠狠插狠狠插| 中文字幕欧美日韩一区| 精品久久久久久中文字幕大豆网| 午夜伦理在线观看| 欧美日本一二三区| 日本精品一二三区| 久久激情影院| 99国产精品9| 免费看大黄毛片全集免费| 欧美乱码精品一区二区| 少妇久久精品一区二区夜夜嗨| 对白刺激国产对白精品城中村| 国产白嫩美女在线观看| 护士xxxx18一19| 日韩无遮挡免费视频| 中文字幕天天躁日日躁狠狠躁免费| 日韩欧美高清一区| 亚洲网站久久| 国产在线一区观看| 欧美日韩国产三区| 热久久国产| 亚洲国产精品一区在线观看| 性生交大片免费看潘金莲| 精品一区在线观看视频| 精品国产乱码一区二区三区在线| 欧洲另类类一二三四区| 国产v亚洲v日韩v欧美v片| 欧美在线视频精品| 欧美日韩国产精品综合| 中文字幕区一区二| 久久久久国产精品www| 92久久精品| 欧美精品在线一区二区| 91人人精品| 国产黄色一区二区三区| 99精品一区| 亚洲精品无吗| 国产日韩欧美精品一区二区| 国产一区二区在线观看免费| 日本99精品| www亚洲精品| 午夜精品一区二区三区三上悠亚| 国产在线卡一卡二| 久久激情影院| 亚洲欧美日本一区二区三区| 日韩精品久久一区二区三区| 亚洲国产精品女主播| 午夜影皖精品av在线播放| 亚洲精品国产综合| 狠狠插狠狠爱| 国产精品69久久久| 精品一区二区超碰久久久| 国产日韩欧美91| 99国产精品永久免费视频| 黄毛片在线观看| 亚洲欧美日韩在线看| 四虎国产精品永久在线国在线 | 91av精品| 欧美日韩精品不卡一区二区三区 | 91丝袜国产在线播放|