日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]用于借助于強化學習來訓練控制策略的設備和方法在審

專利信息
申請?zhí)枺?/td> 202111333359.7 申請日: 2021-11-11
公開(公告)號: CN114536319A 公開(公告)日: 2022-05-27
發(fā)明(設計)人: D·斯捷潘諾娃;J·厄施;N·穆斯里烏;T·艾特爾;F·M·里希特 申請(專利權)人: 羅伯特·博世有限公司
主分類號: B25J9/16 分類號: B25J9/16;B25J13/00;G06N3/02;G06N3/08
代理公司: 中國專利代理(香港)有限公司 72001 代理人: 孫云漢;劉春元
地址: 德國斯*** 國省代碼: 暫無信息
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 用于 借助于 強化 學習 訓練 控制 策略 設備 方法
【權利要求書】:

1.一種用于借助于強化學習來訓練控制策略的方法,所述方法具有:

執(zhí)行多次強化學習訓練遍歷,其中在每次強化學習訓練遍歷中,針對代理的狀態(tài)序列的每個狀態(tài)從控制遍歷的初始狀態(tài)開始選擇所要執(zhí)行的行動,其中針對所述狀態(tài)中的至少有些狀態(tài),通過指定計劃范圍來選擇相應的行動,所述計劃范圍指定了狀態(tài)數目;

通過將回答集編程求解器應用于回答集編程程序,確定具有指定的狀態(tài)數目的從相應的狀態(tài)出發(fā)可到達的狀態(tài)的多個序列,所述回答集編程程序對行動與通過所述行動所到達的后續(xù)狀態(tài)之間的關系進行建模;

從所確定的序列中,選擇在所述所確定的序列中提供最大回報的序列,其中由所確定的序列提供的回報是在到達所述序列的狀態(tài)時所獲得的獎勵的總和;而且

選擇能用來從相應的狀態(tài)出發(fā)到達所選擇的序列的第一狀態(tài)的行動,作為針對所述相應的狀態(tài)的行動。

2.根據權利要求1所述的方法,其中針對在強化學習訓練遍歷中所到達的狀態(tài),檢查所述狀態(tài)在所述多次強化學習訓練遍歷中是否是第一次到達的,而且如果所述狀態(tài)在所述多次強化學習訓練遍歷中是第一次到達的,則通過確定所述多個序列、選擇在所述所確定的序列中提供最大回報的序列并且選擇能用來從所述狀態(tài)出發(fā)到達所選擇的序列的第一狀態(tài)的行動來確定所述行動。

3.根據權利要求2所述的方法,其中針對在所述多次強化學習訓練遍歷中已經到達的狀態(tài),按照到目前為止經訓練的控制策略或者隨機選擇所述行動。

4.根據權利要求1至3中任一項所述的方法,其中針對所述狀態(tài)中的至少有些狀態(tài),通過指定第一計劃范圍來選擇相應的行動,所述第一計劃范圍指定了第一數目的狀態(tài);

通過將回答集編程求解器應用于回答集編程程序,確定具有所述第一數目的狀態(tài)的從所述狀態(tài)出發(fā)可到達的狀態(tài)的多個序列,所述回答集編程程序對行動與通過所述行動所到達的后續(xù)狀態(tài)之間的關系進行建模;

而且如果籌措到指定的供支配的計算預算用來確定針對相應的狀態(tài)的行動,則從具有所述第一數目的狀態(tài)的所確定的序列中選擇在所述所確定的序列中提供最大回報的序列,并且選擇能用來從所述相應的狀態(tài)出發(fā)到達所選擇的序列的第一狀態(tài)的行動,作為針對所述相應的狀態(tài)的行動;

而且如果尚未籌措到指定的供支配的計算預算用來確定針對所述相應的狀態(tài)的行動,則

指定第二計劃范圍,所述第二計劃范圍指定了第二數目的狀態(tài),其中狀態(tài)的第二數目大于狀態(tài)的第一數目,

通過將所述回答集編程求解器應用于回答集編程程序,確定具有所述第二數目的狀態(tài)的從所述狀態(tài)出發(fā)可到達的狀態(tài)的多個序列,所述回答集編程程序對行動與通過所述行動所到達的后續(xù)狀態(tài)之間的關系進行建模,

從具有所述第二數目的狀態(tài)的所確定的序列中選擇在所述所確定的序列中提供最大回報的序列,并且

選擇能用來從所述相應的狀態(tài)出發(fā)到達所選擇的序列的第一狀態(tài)的行動,作為針對所述相應的狀態(tài)的行動。

5.根據權利要求1至4中任一項所述的方法,其中所述回答集編程求解器支持多重求解,而且其中借助于所述回答集編程求解器通過多重求解來為在強化學習訓練遍歷中連續(xù)的狀態(tài)確定所述多個序列。

6.一種控制方法,所述控制方法具有:基于根據權利要求1至5中任一項所訓練的控制策略來控制機器人裝置。

7.一種控制設備,所述控制設備被設立為實施根據權利要求1至6中任一項所述的方法。

8.一種計算機程序,其具有程序指令,當所述程序指令由一個或多個處理器來實施時,所述程序指令使所述一個或多個處理器執(zhí)行根據權利要求1至6中任一項所述的方法。

9.一種計算機可讀存儲介質,在其上存儲有程序指令,當所述程序指令由一個或多個處理器來實施時,所述程序指令使所述一個或多個處理器執(zhí)行根據權利要求1至6中任一項所述的方法。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅伯特·博世有限公司,未經羅伯特·博世有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202111333359.7/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業(yè)標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲自拍偷拍一区二区三区| 日韩精品一区二区不卡| 国产一区二区三区大片| 一区二区三区国产视频| 欧美xxxxhdvideos| 国产精品久久亚洲7777| 国产精品久久久av久久久| 国产午夜精品一区二区三区四区| 欧美日韩国产一二三| 国内少妇自拍视频一区| 国产精品自拍在线观看| 日韩亚洲国产精品| 日韩精品一区中文字幕| 国产精品久久久久久久综合| 久久99精| 一本大道久久a久久精品| 911久久香蕉国产线看观看| 国产精品美女www爽爽爽视频| 亚洲国产精品一区在线观看| 国产精品视频一区二区三| 少妇bbwbbwbbw高潮| 一区二区三区国产精华| 91av中文字幕| 香蕉av一区二区| 亚洲精品久久在线| 久久久久久久亚洲视频| 亚洲久色影视| 国产免费一区二区三区网站免费| 日韩欧美中文字幕精品| 岛国黄色网址| 97精品久久人人爽人人爽| 91精品国产高清一二三四区| 亚洲精品国产setv| 日韩一级在线视频| 色综合久久精品| 99国产精品久久久久老师| 国产69精品久久99不卡解锁版| 国产91精品一区二区麻豆亚洲| 狠狠插影院| 91精品国产91久久久| 91精品啪在线观看国产线免费| 午夜叫声理论片人人影院| 久久久国产精品一区| 91看黄网站| 欧美国产三区| 国产www亚洲а∨天堂| 美女直播一区二区三区| 特高潮videossexhd| 日韩欧美多p乱免费视频| 91精品高清| 亚洲理论影院| 91精品国产九九九久久久亚洲| 国产欧美一区二区三区在线播放| 999久久久国产| 国产一区二区三区精品在线| 久久aⅴ国产欧美74aaa| 精品国产乱码久久久久久久久| 一本久久精品一区二区| 精品国产乱码久久久久久虫虫| 国产高清一区二区在线观看| 亚洲精品一区二区三区98年| 欧美精品国产精品| 欧洲国产一区| 美国一级片免费观看| 99精品国产一区二区三区麻豆| 好吊色欧美一区二区三区视频 | 亚洲欧美制服丝腿| 国产日产精品一区二区| 久久精品国产96| 日本高清不卡二区| 欧美亚洲精品一区二区三区| 日韩欧美中文字幕一区| 午夜av影视| 狠狠色噜噜狠狠狠狠视频| 国产一区二区91| 欧美精品在线一区二区| 国产精品久久免费视频在线| 高清人人天天夜夜曰狠狠狠狠| 国产精品日韩在线观看| 精品久久久综合| 欧美一区二区三区久久久| 性色av香蕉一区二区| 国产精品麻豆99久久久久久| 中文字幕+乱码+中文字幕一区| 欧美二区在线视频| 国产一区二区三区色噜噜小说| 免费观看黄色毛片| 免费毛片**| 久久精品国产亚洲7777 | 中文在线一区二区三区| 国产精品欧美日韩在线| 日本一区二区三区免费视频| 国产欧美一区二区三区免费| 国产精品伦一区二区三区在线观看| 久久婷婷国产综合一区二区| 欧美午夜羞羞羞免费视频app| 亚洲精品久久久久中文第一暮| 国产精品亚洲精品一区二区三区| 国产精品自产拍在线观看蜜| 国产精品久久久久久久久久不蜜月 | 国产免费区| 国产精品欧美久久| yy6080影院旧里番乳色吐息| 国产精品三级久久久久久电影| 午夜激情综合网| 国产呻吟久久久久久久92| 久久亚洲精品国产日韩高潮| 国产有码aaaae毛片视频| 国产一区二区三区大片| 色就是色欧美亚洲| www亚洲精品| 亚洲国产精品综合| 国产日产精品一区二区| 日韩欧美多p乱免费视频| 日本美女视频一区二区三区| 欧美一区二区三区性| 久久一区二区视频| 日韩精品一区在线观看 | 国产精品综合在线观看| 久久青草欧美一区二区三区| 68精品国产免费久久久久久婷婷| 88国产精品视频一区二区三区 | 亚洲一区二区国产精品| 欧美日韩激情一区二区| 久久精品亚洲精品国产欧美| 中文字幕日韩精品在线| 国产精品一二三四五区| 精品国产乱码久久久久久久| 久久综合伊人77777麻豆最新章节| 国产99视频精品免费视频7| 狠狠色依依成人婷婷九月| 国产一卡二卡在线播放| 精品国产九九| 91黄在线看| 一区二区不卡在线| 少妇又紧又色又爽又刺激的视频| 日本xxxx护士高潮hd| 亚洲国产aⅴ精品一区二区16| 亚洲福利视频二区| 亚洲一区二区三区加勒比| 欧美极品少妇| 久久一区二区三区欧美| 香港三日本8a三级少妇三级99 | 国产欧美日韩亚洲另类第一第二页| 久久综合伊人77777麻豆| 国产一区午夜| 国产麻豆91欧美一区二区| 国产伦精品一区二区三区免费优势 | 99久久婷婷国产综合精品草原 | 国产精品日产欧美久久久久| 在线观看v国产乱人精品一区二区| 亚洲乱视频| 91avpro| 欧美日韩国产精品一区二区三区| 亚洲国产偷| 国产一区二区三区影院| 中文丰满岳乱妇在线观看| 欧美日韩卡一卡二| а√天堂8资源中文在线| av午夜在线| 老太脱裤子让老头玩xxxxx| 国产一级一片免费播放| 国产一区免费播放| 亚洲乱强伦| 日本一区二区三区在线看| 亚洲免费永久精品国产 | 国产精品一区二区在线观看| 日韩欧美国产精品一区| 91麻豆精品国产91久久久资源速度| 亚洲高清久久久| 亚洲精品国产精品国产| 国产精品二区一区| 精品在线观看一区二区| 久久一区二区三区视频| 久久久久久久国产| 国产精品偷伦一区二区| 亚洲高清久久久| 一级午夜电影| 午夜av免费看| 对白刺激国产对白精品城中村| 日本一区二区三区免费视频| 国产男女乱淫真高清视频免费| 国产精品1区二区| 激情久久影院| 国产精品高潮呻吟三区四区| 亚洲精品老司机| 97国产婷婷综合在线视频,| 久久精品—区二区三区| 高清在线一区二区| 欧美一级片一区| 国产91电影在线观看| 精品99在线视频| 精品福利一区二区| 欧美日韩激情在线| 亚洲欧美日本一区二区三区| 久久婷婷国产香蕉| 激情aⅴ欧美一区二区三区| 午夜影院一区二区| 国产99视频精品免视看芒果| 中文字幕在线播放一区| 国产一区正在播放| 欧美hdxxxx| 中文字幕一区三区| 欧美视屏一区二区| 99久久精品一区字幕狠狠婷婷 | 欧美色综合天天久久| 亚洲欧美一区二区精品久久久| 日韩精品中文字幕久久臀| 狠狠色丁香久久综合频道日韩| 久久精品亚洲一区二区三区画质| 91久久香蕉| 久久国产精品首页| 亚洲w码欧洲s码免费| 日韩精品一区中文字幕| 国产午夜亚洲精品羞羞网站 | 久久精品综合| 偷拍久久精品视频| 99国产精品免费| 欧美高清xxxxx| 国产经典一区二区| 国v精品久久久网| 精品国产乱码久久久久久老虎| 国产精品日产欧美久久久久| 中文字幕一二三四五区| 精品久久小视频| 国产偷亚洲偷欧美偷精品| 亚洲国产欧美一区二区丝袜黑人| 99国产精品永久免费视频| 国产精品入口麻豆九色| 欧美视屏一区二区| 日本精品在线一区| 国产影院一区二区| 国产亚洲综合一区二区| 久久91久久久久麻豆精品| 国产女人与拘做受免费视频| 国产精品v欧美精品v日韩精品v| 波多野结衣女教师30分钟| 国产乱色国产精品播放视频| 99久久婷婷国产精品综合| 福利视频亚洲一区| 国产一区二区片| 国产一区二| 久久国产精品欧美| 夜夜爱av| 免费精品一区二区三区第35| 老太脱裤子让老头玩xxxxx|