日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于動態模型與事后經驗回放的多目標機器人控制方法有效

專利信息
申請號: 202011281615.8 申請日: 2020-11-16
公開(公告)號: CN112518742B 公開(公告)日: 2022-01-25
發明(設計)人: 李秀;楊瑞;呂加飛;楊宇 申請(專利權)人: 清華大學深圳國際研究生院
主分類號: B25J9/16 分類號: B25J9/16;B25J13/00;G06F30/27;G06N7/00;G06F113/28
代理公司: 深圳新創友知識產權代理有限公司 44223 代理人: 江耀純
地址: 518055 廣東省深圳市*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 動態 模型 事后 經驗 回放 多目標 機器人 控制 方法
【權利要求書】:

1.一種基于動態模型與事后經驗回放的多目標機器人控制方法,其特征在于:具體方法如下:

S1、設定多目標強化學習參數;所述的多目標強化學習參數具體如下:

將強化學習表示為馬爾可夫決策過程MDP,MDP包含了五元組(S,A,R,P,γ),其中S代表狀態空間,A代表動作空間,R代表獎勵函數,P代表狀態轉移概率矩陣,γ代表折扣因子;智能體每個時刻觀測到狀態st,根據狀態執行動作αt,環境接收到動作后轉移到下一個狀態st+1并反饋獎勵rt,強化學習優化的目標是最大化累積獎勵值智能體根據策略π(αt|st)選擇動作;

S2、在多目標強化學習的參數設定下,得到確定性策略梯度算法Actor和Critic的損失函數Lactor和Lcritic;具體如下:

確定性策略梯度算法DDPG基于Actor Gritic架構,Gritic部分對狀態動作進行評估,Actor部分即為選擇動作的策略,在多目標強化學習的設定下,Actor、Gritic的損失函數Lactor,Lcritic分別為:

where Qtarget=rt+γQ(st+1,π(st+1,g),g)

其中g代表目標空間中的一個目標;

S3、建立動態模型,基于動態模型與單步值函數估計和多步值函數展開來加速多目標強化學習訓練;包括:

首先根據交互數據訓練一個環境的動態模型來最小化下一狀態估計誤差:

然后從某個狀態動作對出發,利用策略與動態模型進行交互,產生新的數據其中狀態s由M計算,獎勵r由獎勵函數計算,使用單步值函數估計和多步值函數展開的加權平均,帶權的具有以下形式:

其中α是可以調節的參數;

S4、利用事后經驗回放技術,在多目標強化學習中,將失敗經歷的目標替換為實際完成的目標。

2.根據權利要求1所述的一種基于動態模型與事后經驗回放的多目標機器人控制方法,其特征在于:動作值函數其中Q(st,αt)代表在狀態st執行動作αt后的期望累積獎勵。

3.根據權利要求2所述的一種基于動態模型與事后經驗回放的多目標機器人控制方法,其特征在于:多目標強化學習中,智能體的策略和獎勵函數都受到目標g的調節,獎勵函數、值函數、策略具有以下表示:r(st,αt,g),Q(st,αt,g),π(st,g);使用成功與否來設置獎勵函數,即完成目標獎勵為0,未完成目標獎勵為-1,用φ表示狀態到目標的映射,∈表示設定達到目標的閾值,獎勵函數表示為

4.根據權利要求1所述的一種基于動態模型與事后經驗回放的多目標機器人控制方法,其特征在于:當α接近0時,接近于單步的展開,此時是沒有模型誤差的但是學習速度較慢,當α增加的時候,包含更多的值函數展開信息,但同時帶來更多偏差,因此α起到權衡基于模型的多步信息和模型偏差的作用。

5.根據權利要求1所述的一種基于動態模型與事后經驗回放的多目標機器人控制方法,其特征在于:通過調節α和步數n加速智能體的訓練。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學深圳國際研究生院,未經清華大學深圳國際研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011281615.8/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美精品日韩| 国产三级国产精品国产专区50| 午夜影院h| 国产二区免费| 国产区一区| 97人人澡人人添人人爽超碰| av毛片精品| 亚洲精品老司机| 国产精品视频1区| 国产偷亚洲偷欧美偷精品| 国产伦理久久精品久久久久| 国产亚洲精品久久19p| 日韩精品一区二区中文字幕| 久久午夜鲁丝片午夜精品| 午夜爽爽爽男女免费观看| 日韩精品免费一区| 性old老妇做受| 国产视频一区二区在线| 99久精品视频| 91一区在线| 蜜臀久久久久久999| 国产精品视频二区不卡| 日韩国产欧美中文字幕| 国产精品一区二区中文字幕| 一级女性全黄久久生活片免费| 亚洲自拍偷拍一区二区三区| 99精品久久久久久久婷婷| 国产69精品久久| 精品美女一区二区三区| 国产亚洲精品久久久久久网站| 久久九九亚洲| 欧美午夜一区二区三区精美视频| av午夜在线| 国产美女视频一区二区三区| 亚洲精品乱码久久久久久麻豆不卡| 亚洲欧洲一区二区| 欧美一区二区三区高清视频| 免费毛片a| 亚洲欧美制服丝腿| 午夜精品在线观看| 日本美女视频一区二区| 亚洲欧美一区二区精品久久久| 久久99视频免费| 久久免费福利视频| 香蕉av一区二区三区| 国产资源一区二区| 97精品国产aⅴ7777| 国产午夜精品av一区二区麻豆| 午夜爽爽爽男女免费观看| 午夜影院你懂的| 日本高清h色视频在线观看| 在线观看国产91| 国产精品高清一区| 久99久视频| 国产视频一区二区在线| 91精品国产九九九久久久亚洲| 亚洲精品色婷婷| 国产男女乱淫视频高清免费| 9999国产精品| 久久久久久久国产精品视频| 日韩精品久久久久久久的张开腿让| 鲁丝一区二区三区免费观看| 亚洲国产一区二区精品| 好吊色欧美一区二区三区视频| 国产高清精品一区| 国产无遮挡又黄又爽免费网站| 一区二区三区欧美在线| 国产一区精品在线观看| 日本看片一区二区三区高清| 亚洲国产精品日本| 伊人av综合网| 国产精品亚洲二区| 精品99在线视频| 久久国产精品二区| 91精品视频在线观看免费| 欧美日韩一区电影| 亚洲第一区国产精品| 年轻bbwwbbww高潮| 思思久久96热在精品国产| 91麻豆国产自产在线观看hd | 国产91电影在线观看| 丝袜美腿诱惑一区二区| 欧美精品免费看| 欧美精品久久一区二区| 日韩亚洲国产精品| 偷拍自中文字av在线| 91社区国产高清| 99精品一区二区| 久久99精品国产| 久久精品入口九色| 亚洲精品456| 精品无人国产偷自产在线| 国语对白一区二区| 欧美日韩亚洲三区| 日韩精品一区二区三区不卡| 欧美精品第1页| 99精品区| 国产目拍亚洲精品区一区| 国产欧美一区二区精品久久久| 99久久国产综合精品尤物酒店| 中文乱幕日产无线码1区| 国产精品9区| 日韩免费一级视频| 欧美亚洲另类小说| 国产日韩麻豆| 国产一区二区综合| 国久久久久久| 亚洲精品456| 国产精品乱码久久久久久久| 好吊妞国产欧美日韩免费观看网站| 国产精品高潮呻吟视频| 激情久久综合| 激情久久久| 日韩美一区二区三区| 97久久精品人人做人人爽50路| 国产精品久久久久99| 97久久精品人人澡人人爽| 日本一区二区三区免费在线| 亚洲视频h| 久久精品视频3| 亚洲国产欧美一区| 国产精品久久久久久亚洲调教| 狠狠色综合久久婷婷色天使| 亚洲欧美一卡| 97香蕉久久国产超碰青草软件| 日韩av免费网站| 91亚洲精品国偷拍| 亚洲国产精品网站| 国产欧美精品一区二区三区小说 | 波多野结衣女教师电影| 日本精品一区视频| 999久久国精品免费观看网站| 欧美一区二区三区性| 久久中文一区| 国产99久久久精品视频| 亚洲国产aⅴ精品一区二区16| 欧美日韩国产一二| 国产一区二区在线91| 狠狠躁夜夜躁2020| 久久99精品久久久野外直播内容| 国产欧美日韩精品一区二区三区 | 国产一区三区四区| 国产精品一二三区免费| 99精品久久99久久久久| 久久影视一区二区| 亚洲va欧美va国产综合先锋| 国产一区二区伦理片| 国产三级在线视频一区二区三区| 久久国产欧美一区二区三区精品| 国产精品久久久久激情影院| 久久久午夜爽爽一区二区三区三州| 亚洲精品无吗| 国产伦精品一区二区三区照片91| 99er热精品视频国产| 妖精视频一区二区三区| 日韩av一二三四区| 久久五月精品| av不卡一区二区三区| 欧美精品综合视频| 国产欧美二区| 色一情一交一乱一区二区三区| 国产伦理久久精品久久久久| 狠狠色成色综合网| 亚洲精品少妇久久久久| 亚洲欧美国产日韩综合| 韩日av一区二区| 国产乱老一区视频| 日本不卡精品| 亚洲欧美另类综合| 欧美日韩一区二区三区四区五区| 91麻豆精品国产91久久久更新时间| 日韩精品免费一区二区中文字幕 | 国产欧美一区二区精品久久久| 国产一区免费在线观看| 欧美日韩一区免费| 91精品福利在线| 国产97免费视频| 国产在线一卡| 狠狠色噜噜狠狠狠狠2018| 国产精品9区| 国产午夜一区二区三区| 色综合久久久久久久粉嫩| 久久99精品国产麻豆婷婷| 一区二区三区免费高清视频| 在线精品国产一区二区三区 | 欧美日韩一区视频| 狠狠色狠狠色综合系列| 免费精品99久久国产综合精品应用| 久久99精品国产麻豆婷婷洗澡| 国偷自产中文字幕亚洲手机在线| 国产精品视频一二区| 香蕉视频一区二区三区| 欧洲激情一区二区| 国产一区二区三区色噜噜小说| 欧美极品少妇| 日韩国产精品久久久久久亚洲| 97香蕉久久国产超碰青草软件| 中文字幕在线视频一区二区| 国产精品视频一区二区二| 久久精品视频一区二区| 国产无套精品一区二区| 麻豆91在线| 国产二区不卡| 久久91久久久久麻豆精品| 精品免费久久久久久久苍| 国产精品国精产品一二三区| 国产亚洲久久| 一区二区三区日韩精品| 国产精品久久久麻豆| 国产亚洲精品久久久456| 国产精品999久久久| 国产精品一区二区6| 国产日韩欧美第一页| 欧美人妖一区二区三区| 国产精品美女久久久另类人妖| 夜色av网站| 中文字幕视频一区二区| 91国偷自产一区二区介绍| 久久99精品久久久野外直播内容| 国产三级国产精品国产专区50| 国产午夜一区二区三区| 国产一区二区黄| 欧美精品免费一区二区| 久久国产精品精品国产| 欧美精品一区二区久久| 国产91热爆ts人妖在线| 四虎国产精品永久在线| 97人人模人人爽人人喊38tv| 亚洲欧美一区二区三区1000 | 亚洲五码在线| 国产欧美一区二区三区在线| xxxxhd欧美| 国产91视频一区二区| 午夜欧美影院| 国产精品欧美一区乱破| 丰满岳乱妇在线观看中字| 欧美精品在线视频观看| 夜夜嗨av色一区二区不卡| 国产麻豆一区二区| 久久99精品国产| 亚洲精品91久久久久久| 国产精自产拍久久久久久蜜| 性欧美精品动漫| 午夜码电影| 欧美久久精品一级c片| 欧美一区二区三区三州|