日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于想象力的代理神經網絡在審

專利信息
申請號: 201880028596.2 申請日: 2018-05-22
公開(公告)號: CN110892420A 公開(公告)日: 2020-03-17
發明(設計)人: 丹尼爾·彼得·維爾斯特拉;李宇佳;拉茲萬·帕什卡努;彼得·威廉·巴塔利亞;塞奧法尼·紀堯姆·韋伯;拉爾斯·比辛;戴維·保羅·賴克特;亞瑟·克萊蒙特·格斯;丹尼洛·吉米內斯·雷森德;阿德里亞·普伊赫多梅內奇·巴迪亞;奧里奧爾·溫亞爾斯;尼古拉斯·曼弗雷德·奧托·黑斯;塞巴斯蒂安·亨利·拉卡涅雷 申請(專利權)人: 淵慧科技有限公司
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08;G06N3/00
代理公司: 中原信達知識產權代理有限責任公司 11219 代理人: 李寶泉;任慶威
地址: 英國*** 國省代碼: 暫無信息
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 想象力 代理 神經網絡
【說明書】:

提出了一種神經網絡系統。所述網絡能夠由基于模型的強化學習訓練,以選擇要由與環境交互的代理執行的動作,以執行任務從而試圖實現指定的結果。所述系統可包括:至少一個想象力核心,并且包括所述環境的模型,所述想象力核心具有輸入,以接收表征所述環境的當前狀態的當前觀察,并可選地接收歷史觀察。所述想象力核心可被配置成響應于所述當前觀察和/或歷史觀察而輸出軌跡數據。所述軌跡數據包括所述想象力核心想象的所述環境的未來特征的序列。所述系統還包括:至少一個卷展編碼器,以對所述特征的序列進行編碼;和強化學習輸出級,以接收從所述卷展嵌入中導出的數據,并輸出動作策略數據,從而定義基于所述當前觀察來識別動作的動作策略。

相關申請的交叉引用

本申請是2017年5月19日提交的美國臨時專利申請No.62/509,023的非臨時專利申請并要求其優先權,其公開內容在此通過引用以其整體并入本文。

技術領域

本說明書涉及強化學習。

背景技術

在強化學習系統中,代理通過執行由強化學習系統響應于接收到表征環境的當前狀態的觀察而選擇的動作來與環境交互。

一些強化學習系統響應于根據神經網絡的輸出接收到給定觀察而選擇將由代理執行的動作。

神經網絡是采用一層或多層非線性單元來預測接收到的輸入的輸出的機器學習模型。一些神經網絡是深度神經網絡,除了輸出層外還包括一個或多個隱藏層。每個隱藏層的輸出都用作網絡中的下一層,即下一隱藏層或輸出層的輸入。網絡的每一層都根據相應的一組參數的當前值從接收的輸入生成輸出。

發明內容

本說明書總體上描述了強化學習系統,其選擇待由與環境交互的強化學習代理執行的動作。為了使代理與環境交互,系統接收表征環境的當前狀態的數據,并響應于接收到的數據選擇代理要執行的動作。在本說明書中,表征環境狀態的數據將被稱為觀察。

在一些實施方式中,環境是模擬環境,并且代理被實現為與模擬環境交互的一個或多個計算機程序。例如,模擬環境可以是視頻游戲,并且代理可以是玩視頻游戲的模擬用戶。作為另一示例,模擬環境可以是運動模擬環境,例如駕駛模擬或飛行模擬,并且代理是在運動模擬中導航的模擬車輛。在這些實施方式中,動作可以是控制輸入以控制模擬用戶或模擬車輛。更一般地,環境可以是其中執行機器人控制任務的環境。

因而,在一些其它實施方式中,環境是真實環境,并且代理是與真實環境交互的機械代理。例如,代理可以是與環境交互以完成特定任務的機器人。作為另一示例,代理可以是在環境中導航的自主或半自主車輛。在這些實施方式中,動作可以是控制輸入以控制機器人或自動駕駛車輛。

在本公開的一方面,用于基于模型強化學習的神經網絡系統用于選擇要由與環境交互的代理執行的動作,以執行任務從而試圖實現指定的結果。該系統可包括至少一個想象力核心,該想象力核心具有輸入以接收表征環境的當前狀態的當前觀察并且可選地接收歷史觀察,并且包括環境的模型。想象力核心可被配置成響應于當前觀察和/或歷史觀察而輸出軌跡數據,軌跡數據定義了包括想象力核心想象的環境的未來特征的序列的軌跡(即,基于代理執行某些動作的假設預測的)。該系統還可包括至少一個卷展(rollout)編碼器,以對來自想象力核心的特征的序列進行編碼,從而提供針對該軌跡的卷展嵌入。該系統還可包括強化學習輸出級,以接收從卷展嵌入中導出的數據,并輸出動作策略數據,從而定義基于當前觀察來識別動作的動作策略。

強化學習(RL)輸出級可以是任何類型的RL輸出級。例如,它可以基于策略,例如直接搜索最佳策略并輸出策略數據,并且可選地輸出基線狀態值數據;或者它可以基于值,例如輸出Q值數據。在一些實施方式中,強化學習輸出級包括動作者評價RL(actor-criticRL)輸出級。策略數據可包括定義動作策略的策略向量和用于當前觀察的值基線數據,以確定由動作策略定義的動作的優勢。通常,動作策略數據可使用想象的軌跡作為背景。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淵慧科技有限公司,未經淵慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201880028596.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产伦精品一区二| 国产精品电影一区| 日韩精品一区二区中文字幕| 亚洲精品一区在线| 久久一区二区三区视频| 国产欧美日韩在线观看| 国产精品丝袜综合区另类| 免费观看xxxx9999片| 欧美精品一区免费| 亚洲四区在线| 久久精品亚洲一区二区三区画质| 蜜臀久久99精品久久一区二区| 亚洲国产精品国自产拍久久| 91精品一区在线观看| 欧美乱码精品一区二区| 日韩久久精品一区二区三区| 欧美日韩精品影院| 国产精品伦一区二区三区级视频频| 国产二区视频在线播放 | 日本一区午夜艳熟免费| xxxx18日本护士高清hd| 国产jizz18女人高潮| 日韩毛片一区| 一区二区三区中文字幕| 国产大片黄在线观看私人影院 | 国产黄一区二区毛片免下载| 亚洲欧洲日韩av| 日韩av电影手机在线观看| 亚洲激情中文字幕| 国产一区二区在线精品| 狠狠躁夜夜躁人人爽天天天天97 | 日韩精品中文字幕久久臀| 欧美日韩中文字幕三区| 欧美日韩亚洲国产一区| 欧美在线视频三区| 欧美日韩一区二区三区四区五区| 夜色av网站| 国产一区日韩一区| 国产一区在线视频观看| 日韩中文字幕一区二区在线视频 | 亚洲欧洲精品一区二区三区不卡| а√天堂8资源中文在线| 久久精品99国产国产| 国产日本欧美一区二区三区| 欧美日韩九区| 国产精品视频二区三区| 午夜影院激情| 肥大bbwbbwbbw高潮| 91精品视频一区二区三区| 国产免费一区二区三区四区五区| 久久久久国产精品免费免费搜索| 亚洲第一天堂久久| 精品国产一区二区三区高潮视| 国产精品免费专区| 性刺激久久久久久久久九色| 日本一区二区在线观看视频| 国产精品久久久区三区天天噜| 91夜夜夜| 亚洲欧美日韩视频一区| 国产精品999久久久| 亚洲久久在线| 欧美日韩一区免费| 日韩一区免费| 国产乱码一区二区| 国产农村妇女精品一区二区| 国产黄色一区二区三区| 欧美精品中文字幕在线观看| 国产一级片网站| 91亚洲精品国偷拍自产| 欧美色综合天天久久| 欧美xxxxhdvideos| 91偷拍网站| 91亚洲欧美日韩精品久久奇米色| 综合久久一区二区三区| 午夜剧场一级片| 久久精品国产亚洲一区二区| 国内偷拍一区| 国偷自产一区二区三区在线观看| 国产精品视频二区三区| 年轻bbwbbw高潮| 欧美一级特黄乱妇高清视频| 亚洲天堂国产精品| 国产精品第56页| 国产有码aaaae毛片视频| 一区二区中文字幕在线观看| 国产一区二区三区小说| 91麻豆精品国产自产欧美一级在线观看| 国产九九影院| 色噜噜狠狠色综合中文字幕| 美女直播一区二区三区| 亚洲免费永久精品国产| 日韩无遮挡免费视频| 国产人伦精品一区二区三区| 欧美黄色一二三区| 欧洲在线一区二区| 久久综合国产精品| 色综合久久久| 国产亚洲精品久久久久久网站| 午夜影院5分钟| 亚洲久久在线| 精品国产九九| 精品国产一区二区三区免费| 精品国产亚洲一区二区三区| 91视频国产九色| 久久国产欧美日韩精品| 国产精品亚洲а∨天堂123bt| 国产jizz18女人高潮| 93久久精品日日躁夜夜躁欧美| 日韩精品一区二区三区免费观看| 午夜激情免费电影| 99国产精品欧美久久久久的广告| 国产精品亚洲精品| 国产一级片网站| 亚洲一卡二卡在线| 亚洲精品456| 日韩精品中文字幕久久臀| 精品久久久久久中文字幕大豆网 | 国产目拍亚洲精品区一区| 久久96国产精品久久99软件| 精品久久久久一区二区| 国产999久久久| 国产69精品久久久| 欧美在线播放一区| 午夜在线看片| 亚洲欧美v国产一区二区| 精品国产一区二区在线| 国产伦理一区| 亚洲精品www久久久久久广东| 91精品久久久久久综合五月天| 99久久婷婷国产综合精品草原| 久久精品入口九色| 欧美一区免费| 亚洲精品一区,精品二区| 色综合久久网| 国产69精品福利视频| 国产日韩欧美精品一区| 99视频国产在线| 国内自拍偷拍一区| 国产69精品久久777的优势| 亚洲国产精品国自产拍av| 色综合久久精品| 91久久国产露脸精品| 国产全肉乱妇杂乱视频在线观看 | 黄色av免费| 亚洲乱视频| 日本三级香港三级网站| 午夜色大片| 国产精品一区二区6| 欧美日韩九区| 亚洲欧美另类久久久精品2019| 久久99精品久久久野外直播内容 | 清纯唯美经典一区二区| 午夜亚洲影院| 狠狠色噜噜综合社区| 国产精品久久久久久亚洲调教| 欧美日韩一区二区三区四区五区 | 亚洲神马久久| 国产日韩一区在线| 欧美激情精品久久久久久免费 | 国产精品视频二区不卡| 亚洲欧洲日韩在线| 欧美日韩一区二区三区在线观看视频| 亚洲日韩aⅴ在线视频| 久久午夜精品福利一区二区 | 中文字幕一区二区三区免费视频| 中文字幕欧美日韩一区| 久久艹国产精品| 色噜噜日韩精品欧美一区二区| 免费**毛片| 国产乱对白刺激在线视频| 亚洲国产精品肉丝袜久久| 午夜精品一区二区三区三上悠亚 | 精品久久久久久中文字幕| 999亚洲国产精| 午夜精品99| 亚洲精品一区二区三区香蕉| 国产日产欧美一区| 国产精选一区二区| 丰满少妇高潮惨叫久久久| 欧美日韩一区在线视频| 久久福利免费视频| 精品国产免费久久| 国产激情视频一区二区| 91久久国产视频| 亚洲欧洲精品一区二区三区不卡| 国产69精品久久久久999小说| 国产伦精品一区二区三区免费下载| 亚洲国产精品入口| 91精品一区在线观看| 欧美日韩九区| 夜夜夜夜曰天天天天拍国产 | 男女视频一区二区三区| 中文字幕一区二区三区乱码视频| www.久久精品视频| 香港三日本三级三级三级| 中文在线一区| 国产二区免费| 狠狠色噜噜狠狠狠狠米奇777| 在线视频不卡一区| 欧美日韩国产综合另类| 亚洲国产欧美一区二区丝袜黑人| 国产高清在线精品一区二区三区| 韩国视频一区二区| 自偷自拍亚洲| 午夜精品一区二区三区三上悠亚 | 久久国产欧美一区二区三区免费| 久久综合狠狠狠色97| 日韩欧美国产另类| 在线国产精品一区二区| 狠狠综合久久av一区二区老牛| 国产乱人伦精品一区二区| 国产精一区二区| 亚洲精品久久久久中文第一暮| 视频一区二区国产| 国产精品一区一区三区| 精品久久二区| 国产视频二区在线观看| 97欧美精品| 欧美精品一区二区久久| 日韩精品中文字幕久久臀| 欧美激情视频一区二区三区| 91人人精品| 欧美高清xxxxx| 久久精品国产亚| 久久99精品国产| 亚洲国产一区二区久久久777| 精品国产一区二区三区高潮视| 欧美一区二区伦理片| 91精品国模一区二区三区| 日本黄页在线观看| 欧美日韩国产在线一区| 欧美网站一区二区三区| 黄毛片在线观看| 日韩一区高清| 久久精品综合视频| 国产91刺激对白在线播放| 亚洲欧美日韩国产综合精品二区| 欧美激情片一区二区| 精品国产乱码久久久久久虫虫| 性视频一区二区三区| 国产乱对白刺激视频在线观看| 99国产精品99久久久久| 日韩一区免费在线观看| 久久国产精品久久| 国产一级二级在线| 亚洲va欧美va国产综合先锋|