日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]利用學徒來訓練動作選擇神經(jīng)網(wǎng)絡在審

專利信息
申請?zhí)枺?/td> 201880028844.3 申請日: 2018-06-28
公開(公告)號: CN110651279A 公開(公告)日: 2020-01-03
發(fā)明(設計)人: O.皮埃特奎恩;M.里德米勒;王富民;B.皮奧特;M.維塞里克;T.A.海斯特;T.羅瑟爾;T.蘭普;N.M.O.希斯;J.K.肖爾茨 申請(專利權)人: 淵慧科技有限公司
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08;G06N3/00
代理公司: 11105 北京市柳沈律師事務所 代理人: 金玉潔
地址: 英國*** 國省代碼: 英國;GB
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 重放緩沖器 神經(jīng)網(wǎng)絡 元組 神經(jīng)網(wǎng)絡系統(tǒng) 動作數(shù)據(jù) 獎勵數(shù)據(jù) 演示 評論 緩沖器 存儲狀態(tài)數(shù)據(jù) 環(huán)境狀態(tài)數(shù)據(jù) 神經(jīng)網(wǎng)絡學習 策略函數(shù) 存儲元組 環(huán)境交互 連續(xù)動作 強化學習 狀態(tài)數(shù)據(jù) 新狀態(tài) 映射 配置 集合 代理 觀察 學習
【權利要求書】:

1.一種離策略強化學習參與者-評論者神經(jīng)網(wǎng)絡系統(tǒng),用于選擇將由與環(huán)境交互的代理執(zhí)行的動作以執(zhí)行任務,所述系統(tǒng)包括:

第一輸入,用于接收觀察,所述觀察包括表征環(huán)境的狀態(tài)的狀態(tài)數(shù)據(jù),以及表示從在環(huán)境中用動作進行操作而獲得的獎勵的獎勵數(shù)據(jù);

至少一個參與者神經(jīng)網(wǎng)絡,被耦合以接收狀態(tài)數(shù)據(jù)并被配置為定義將狀態(tài)數(shù)據(jù)映射到定義動作的動作數(shù)據(jù)的策略函數(shù),其中,所述至少一個參與者神經(jīng)網(wǎng)絡具有輸出以提供動作數(shù)據(jù)用于代理執(zhí)行動作,并且其中所述環(huán)境響應于動作而轉變到新狀態(tài);

至少一個評論者神經(jīng)網(wǎng)絡,被耦合以接收動作數(shù)據(jù)、狀態(tài)數(shù)據(jù)以及從獎勵數(shù)據(jù)得到的回報數(shù)據(jù),并被配置為定義生成誤差信號的值函數(shù);

重放緩沖器,用于存儲強化學習轉變,所述強化學習轉變包括來自系統(tǒng)的操作的操作轉變數(shù)據(jù),其中,所述操作轉變數(shù)據(jù)包括所述狀態(tài)數(shù)據(jù)、所述動作數(shù)據(jù)、所述獎勵數(shù)據(jù)和表示所述新狀態(tài)的新狀態(tài)數(shù)據(jù)的元組;以及

第二輸入,用于接收定義演示轉變數(shù)據(jù)的訓練數(shù)據(jù),所述演示轉變數(shù)據(jù)包括來自環(huán)境中的任務的演示的所述元組的集合,其中,存儲在重放緩沖器中的強化學習轉變還包括演示轉變數(shù)據(jù);以及

其中,所述神經(jīng)網(wǎng)絡系統(tǒng)被配置為使用誤差信號并使用來自重放緩沖器的存儲元組來訓練至少一個參與者神經(jīng)網(wǎng)絡和至少一個評論者神經(jīng)網(wǎng)絡離策略,所述重放緩沖器包括來自操作轉變數(shù)據(jù)和演示轉變數(shù)據(jù)兩者的元組。

2.根據(jù)權利要求1所述的系統(tǒng),其中,所述獎勵包括稀疏獎勵,所述稀疏獎勵具有取決于環(huán)境的狀態(tài)的多個離散值。

3.根據(jù)權利要求1或2所述的系統(tǒng),其中,僅環(huán)境的狀態(tài)的少數(shù)子集提供獎勵。

4.根據(jù)權利要求1,2或3所述的系統(tǒng),還包括:采樣選擇系統(tǒng),用于根據(jù)采樣概率對強化學習轉變進行采樣,其中,所述采樣概率優(yōu)先對演示轉變數(shù)據(jù)元組進行采樣。

5.根據(jù)權利要求1至4中的任一項所述的系統(tǒng),其中,所述回報數(shù)據(jù)包括獎勵數(shù)據(jù)和來自評論者神經(jīng)網(wǎng)絡的值的組合,所述評論者神經(jīng)網(wǎng)絡的值是從使用參與者神經(jīng)網(wǎng)絡所選擇的動作的(n-1)步向前展示而獲得的;并且其中,所述系統(tǒng)被配置為采用至少兩個不同的n值來訓練網(wǎng)絡。

6.根據(jù)權利要求1至5中的任一項所述的系統(tǒng),被配置為使用包括1步回報和n步回報的混合的回報數(shù)據(jù)來訓練評論者神經(jīng)網(wǎng)絡。

7.根據(jù)權利要求1至6中任一項所述的系統(tǒng),包括學習參與者神經(jīng)網(wǎng)絡和目標參與者神經(jīng)網(wǎng)絡以及學習評論者神經(jīng)網(wǎng)絡和目標評論者神經(jīng)網(wǎng)絡,其中,所述神經(jīng)網(wǎng)絡系統(tǒng)被配置為使用誤差信號更新學習評論者神經(jīng)網(wǎng)絡離策略,其中,從目標評論者神經(jīng)網(wǎng)絡、目標參與者神經(jīng)網(wǎng)絡以及操作轉變數(shù)據(jù)和演示轉變數(shù)據(jù)的存儲元組得到誤差信號;其中,所述系統(tǒng)被配置為使用確定性策略梯度來更新學習參與者神經(jīng)網(wǎng)絡,所述確定性策略梯度包括使用操作轉變數(shù)據(jù)和演示轉變數(shù)據(jù)的存儲元組評估的學習評論者神經(jīng)網(wǎng)絡的輸出的梯度與學習參與者神經(jīng)網(wǎng)絡的輸出的梯度的乘積;并且其中,所述系統(tǒng)被配置為按照一定間隔使用學習參與者神經(jīng)網(wǎng)絡來更新目標參與者神經(jīng)網(wǎng)絡的權重,并使用學習評論者神經(jīng)網(wǎng)絡來更新目標評論者神經(jīng)網(wǎng)絡的權重。

8.根據(jù)權利要求1至7中的任一項所述的系統(tǒng),其中,所述訓練數(shù)據(jù)包括來自機械系統(tǒng)的操縱的運動學教導數(shù)據(jù)。

9.根據(jù)權利要求1至8中的任一項所述的系統(tǒng),還包括安全控制器,用于對動作數(shù)據(jù)施加安全性或其他約束。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淵慧科技有限公司,未經(jīng)淵慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201880028844.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品1区2区| 亚洲麻豆一区| 最新国产精品自拍| 国产日韩欧美不卡| 午夜毛片电影| 精品国产一区二区三区在线| 日韩精品一区三区| 99re国产精品视频| 大bbw大bbw巨大bbw看看| 国产精品欧美日韩在线| 午夜情所理论片| 精品国产乱码久久久久久久久| 亚洲欧美日韩综合在线| 激情久久影院| 亚洲午夜精品一区二区三区| 曰韩av在线| 国产精彩视频一区二区| 亚洲欧美日韩国产综合精品二区 | 色噜噜日韩精品欧美一区二区| 久久两性视频| 国产jizz18女人高潮| 日韩精品中文字幕一区二区三区| 91精品第一页| 国产女人好紧好爽| 亚洲色欲色欲www| 欧美精品第一区| 国产精品久久国产三级国电话系列 | 综合在线一区| 91精品黄色| xxxx在线视频| 国内少妇自拍视频一区| 日本五十熟hd丰满| 日本一区二区三区免费视频| 91久久精品国产91久久性色tv| 久久第一区| 午夜理伦影院| 国产1区2| 久久综合伊人77777麻豆最新章节| 香港日本韩国三级少妇在线观看| 国产精品一区二区毛茸茸| free性欧美hd另类丰满| 国产一区二区91| 国产精品美乳在线观看| 日韩欧美中文字幕一区| 亚洲精品一区二区另类图片| 亚洲欧美日韩精品suv| 狠狠操很很干| 国产第一区在线观看| 国产91白嫩清纯初高中在线| 一区二区欧美精品| 日韩一级视频在线| 国产欧美精品一区二区三区小说| 日韩亚洲欧美一区| 狠狠色狠狠色合久久伊人| 国产亚洲精品久久19p| 国产日韩欧美中文字幕| 99久久精品免费看国产免费粉嫩 | 欧美乱妇高清无乱码免费| 中文字幕一级二级三级| 亚洲国产精品国自产拍av| 日本精品99| 国产一区二区三区精品在线| 国产午夜精品一区| 国产第一区二区| 国产日产精品一区二区| 黄色av中文字幕| 精品国产一区在线| 91久久香蕉| 久久精品99国产国产| 综合久久激情| 久久99精品久久久大学生| 精品一区中文字幕| 久久久久久久亚洲国产精品87| 国产亚洲精品久久久久动| 99久久精品国产系列| 国产精品国产亚洲精品看不卡15| 国产69精品久久久久按摩| 最新国产精品自拍| 91精品视频在线观看免费| 亚洲国产精品97久久无色| 亚洲第一天堂无码专区| 99精品偷拍视频一区二区三区| 免费精品一区二区三区视频日产| 狠狠躁夜夜| 国产第一区二区| 欧美日韩国产一级| 亚洲国产精品综合| 午夜电影毛片| 精品国产区| 狠狠躁夜夜躁人人爽天天天天97| 亚洲精品久久久久中文字幕欢迎你| 日本一码二码三码视频| 中文字幕一区一区三区| 中文字幕一区二区三区乱码视频| 狠狠色丁香久久综合频道| 国产高清精品一区| 国产精品亚洲欧美日韩一区在线| 少妇高潮大叫喷水| 久久精品视频3| 在线观看黄色91| 亚洲精品久久久久www| 亚洲精品少妇一区二区| 国产呻吟久久久久久久92| 国产suv精品一区二区4| 狠狠躁狠狠躁视频专区| xxxx18hd护士hd护士| 久久夜色精品亚洲噜噜国产mv| 午夜精品一二三区| 一区二区三区香蕉视频| 国产一二区在线 | 国产性生交xxxxx免费| 国产偷亚洲偷欧美偷精品| 久热精品视频在线| 亚洲精品20p| 日本福利一区二区| 国产一区2| 一区二区在线国产| 夜色av网| 国产精品奇米一区二区三区小说| 日本三级不卡视频| 日本久久不卡| 国产91免费观看| 一级黄色片免费网站| 最新av中文字幕| 国产精品一区二区人人爽| 少妇高潮在线观看| 91麻豆精品国产自产欧美一级在线观看 | 91久久一区二区| 欧美精品久久一区二区| 99日韩精品视频| 国产一级在线免费观看| 国产精品久久久久久久久久久新郎 | 97久久精品人人做人人爽| 色一情一乱一乱一区99av白浆| 久久福利视频网| 高清欧美精品xxxxx在线看| 欧美日韩不卡视频| 国产一区免费在线观看| 国产欧美日韩精品一区二区图片| 欧美一区二区在线不卡| 午夜社区在线观看| 欧美性二区| 国产欧美视频一区二区三区| 激情久久久久久| 国产精品一级在线| 国产精欧美一区二区三区久久久| 亚洲精品国产久| 亚洲一区中文字幕| 日韩精品人成在线播放| 性夜影院在线观看| 香港三日本三级三级三级| 日韩精品一区二区免费| 国产精品刺激对白麻豆99| 一色桃子av| 国产精品高潮呻吟88av| 欧美激情综合在线| 国产一区二区三区午夜| 日韩在线一区视频| 午夜激情电影院| 国产一区二区视频免费在线观看| 亚洲国产美女精品久久久久∴| 国产精品高潮呻吟视频| 色就是色欧美亚洲| 国产精品人人爽人人做av片| 久久99精品久久久大学生| 四虎国产永久在线精品| 国产精选一区二区| 国产一区二三| 四虎国产精品永久在线国在线| 国产又色又爽无遮挡免费动态图| 国产在线一卡二卡| 在线观看欧美日韩国产| 四虎国产精品永久在线国在线| 国产日韩精品久久| 性少妇freesexvideos高清bbw| 欧美一区二区免费视频| 中文乱码字幕永久永久电影| 欧美精品久久一区| 国产精品久久久久久久久久久杏吧| 日韩av免费网站| 亚洲w码欧洲s码免费| 国产一二区在线| 亚洲1区2区3区4区| 国产精品中文字幕一区二区三区 | 免费午夜片| 国产91在| 国产精彩视频一区二区| 日本精品一区二区三区视频| 日本午夜一区二区| 亚洲午夜精品一区二区三区电影院| 国产偷久久一区精品69| 免费久久99精品国产婷婷六月| 欧美一区二区三区片| 91精品视频一区二区三区| 国产日韩欧美三级| 亚洲午夜精品一区二区三区| 久久密av| 欧洲在线一区| 一区二区三区欧美日韩| 国产精品国外精品| 国产午夜一级片| 国产一区www| 999久久久国产| 欧美一区二区三区高清视频| 国产精品日韩视频| 色午夜影院| 68精品国产免费久久久久久婷婷| 国产69精品久久久久按摩| 在线国产一区二区| 国产精自产拍久久久久久蜜| 久久99亚洲精品久久99果| 久久精品国产色蜜蜜麻豆| 狠狠色噜噜狠狠狠四色米奇| 精品久久久久久中文字幕大豆网| 国产伦精品一区二区三区免费优势| 国产欧美日韩一级大片| 日本边做饭边被躁bd在线看 | 日本高清二区| 午夜电影毛片| 日韩中文字幕亚洲欧美| 九九久久国产精品| 亚洲欧洲精品一区二区三区不卡| 精品久久久久久亚洲综合网| 日韩一级免费视频| 国产精品亚洲二区| 欧美日韩卡一卡二| 国产色99| 中文字幕在线一区二区三区| 国产亚洲精品精品国产亚洲综合 | 欧美一区二区三区激情| 欧美日韩一级在线观看| 精品久久久久99| 狠狠色狠狠色88综合日日91| 国产性猛交| 国产欧美日韩一级大片| 国模一区二区三区白浆| 欧美福利一区二区| 国产黄一区二区毛片免下载| 国产91视频一区二区| 欧美3级在线| 午夜看片在线| 激情久久一区二区| 高清在线一区二区| 国产91久久久久久久免费| 亚洲欧美色一区二区三区| 狠狠插狠狠爱|