日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于模型不確定性與行為先驗的控制策略離線訓練方法在審

專利信息
申請?zhí)枺?/td> 202310064893.5 申請日: 2023-02-06
公開(公告)號: CN115972211A 公開(公告)日: 2023-04-18
發(fā)明(設(shè)計)人: 章宗長;俞揚;周志華;周韌哲 申請(專利權(quán))人: 南京大學
主分類號: B25J9/16 分類號: B25J9/16
代理公司: 南京樂羽知行專利代理事務(wù)所(普通合伙) 32326 代理人: 李玉平
地址: 210023 江蘇*** 國省代碼: 江蘇;32
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 模型 不確定性 行為 先驗 控制 策略 離線 訓練 方法
【說明書】:

發(fā)明公開一種基于模型不確定性和行為先驗的控制策略離線訓練方法,通過在機械臂操作離線數(shù)據(jù)上訓練集成動力學模型來構(gòu)建對機械臂數(shù)據(jù)樣本的不確定性度量,并采用變分自編碼器來擬合收集該機械臂離線數(shù)據(jù)的行為先驗策略,在加權(quán)貝爾曼更新的框架下僅使用機械臂離線數(shù)據(jù)來訓練機械臂的控制策略。本發(fā)明能夠使機械臂控制策略在離線訓練的過程中有選擇性地利用機械臂的離線數(shù)據(jù)集,減小不可信的機械臂數(shù)據(jù)樣本對策略訓練的影響,同時使可信的機械臂數(shù)據(jù)樣本仍然能對策略訓練起到正向作用,能夠使得機械臂控制策略的離線學習過程更加穩(wěn)定并提升機械臂控制策略的性能。

技術(shù)領(lǐng)域

本發(fā)明涉及一種基于模型不確定性與行為先驗的控制策略離線訓練方法,用于學習機械臂的控制策略。

背景技術(shù)

強化學習是機器學習中一個重要的分支領(lǐng)域,智能體可以借助強化學習方法,通過與環(huán)境交互得到獎賞或懲罰信號,并據(jù)此學習到能在環(huán)境中得到最高獎賞的策略。然而,強化學習方法通常需要不斷地與環(huán)境進行交互來獲取可供學習的經(jīng)驗,在機械臂相關(guān)的任務(wù)上,這些與操作環(huán)境的交互需要消耗大量的時間與經(jīng)濟成本。

離線強化學習為解決這一問題提供了一種新的思路,從一個先前收集到的機械臂操作數(shù)據(jù)集中學習策略,而不與環(huán)境進行交互,免去了在環(huán)境中采樣所需的時間、經(jīng)濟成本。

然而,由于采集機械臂操作數(shù)據(jù)的行為策略和當前待學習的控制策略存在的分布不匹配的問題,直接從機械臂操作離線數(shù)據(jù)中無法訓練出表現(xiàn)好的策略。對此,近年來的技術(shù)方案大都是基于策略分布限制或者價值保守估計,沒有仔細考慮不同的機械臂操作數(shù)據(jù)的差別,比如在機械臂操作數(shù)據(jù)中可能存在一些誤操作數(shù)據(jù),這些數(shù)據(jù)對機械臂控制策略的學習是不利的,限制了機械臂控制策略在使用這些數(shù)據(jù)進行離線學習后的性能。

發(fā)明內(nèi)容

發(fā)明目的:針對現(xiàn)有離線強化學習技術(shù)在學習機械臂控制策略中的問題與不足,本發(fā)明提供一種基于模型不確定性與行為先驗的控制策略離線訓練方法,通過在機械臂離線數(shù)據(jù)上訓練集成動力學模型與變分自編碼器來提供對機械臂操作數(shù)據(jù)的置信度區(qū)分,在加權(quán)貝爾曼更新的框架下來離線訓練機械臂的控制策略,能夠使得機械臂控制策略的離線學習過程更加穩(wěn)定并提升機械臂控制策略的性能。

技術(shù)方案:一種基于模型不確定性與行為先驗的控制策略離線訓練方法,在機械臂離線數(shù)據(jù)上訓練集成動力學模型來構(gòu)建對機械臂數(shù)據(jù)樣本的不確定性度量,并采用變分自編碼器來擬合收集該機械臂離線數(shù)據(jù)的行為先驗策略,讓機械臂控制策略不斷與集成動力學模型交互來獲取更多的機械臂操作數(shù)據(jù),在加權(quán)貝爾曼更新的框架下僅使用機械臂離線數(shù)據(jù)與模型數(shù)據(jù)來訓練機械臂的控制策略。

包括如下步驟:

步驟1:在機械臂裝配操作數(shù)據(jù)集上訓練集成動力學模型,所得模型可以模擬真實的機械臂操作環(huán)境;

步驟2:在機械臂裝配操作數(shù)據(jù)集上訓練變分自編碼器,所得行為先驗?zāi)P涂梢阅M采集這些數(shù)據(jù)的行為策略;

步驟3:開始訓練基于行為者-評論家的策略網(wǎng)絡(luò),所述基于行為者-評論家的策略網(wǎng)絡(luò)為機械臂控制策略,控制策略與集成動力學模型交互生成機械臂的操作樣本,存入模型數(shù)據(jù)集中;

步驟4:從混合數(shù)據(jù)集中采樣小批量的機械臂操作樣本,計算樣本的模型不確定性與解碼器重構(gòu)概率,并計算樣本的貝爾曼更新權(quán)重;

步驟5:使用采樣的小批量機械臂操作樣本來進行加權(quán)貝爾曼更新訓練值函數(shù)、目標值函數(shù)與控制策略;

步驟6:重復步驟3-5,控制策略訓練達到收斂后,完成訓練過程。

對機械臂控制策略所要面對的機械臂操作環(huán)境進行建模得到集成動力學模型,機械臂控制策略可與集成動力學模型交互來擴充機械臂的數(shù)據(jù)集,并基于集成動力學模型誤差提供機械臂狀態(tài)-動作對的不確定性估計;

對采集機械臂離線數(shù)據(jù)的行為策略進行建模,得到行為先驗?zāi)P停袨橄闰災(zāi)P湍芴峁C械臂狀態(tài)-動作對在行為策略下的出現(xiàn)概率;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學,未經(jīng)南京大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310064893.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产欧美日韩在线观看| 91麻豆精品国产91久久久更新时间| 性old老妇做受| 国产精欧美一区二区三区久久久| 国产真实乱偷精品视频免| 国产品久精国精产拍 | 色婷婷精品久久二区二区6| 91黄在线看| 国产一区二三| 国产69精品久久久久999天美| 99精品国产免费久久| 在线国产91| 国产欧美视频一区二区三区| 97香蕉久久国产超碰青草软件| 欧洲国产一区| 麻豆天堂网| 91国偷自产一区二区介绍| 日本一区二区在线观看视频| 国产97在线看| 久99久视频| 久久一区二区精品| 中文乱幕日产无线码1区| 亚洲国产精品一区二区久久hs | 亚洲精品国产setv| 国产日产精品一区二区| 97精品超碰一区二区三区| 91午夜在线观看| 日韩夜精品精品免费观看| 精品少妇一区二区三区免费观看焕| 91精品黄色| 精品无人国产偷自产在线 | 中文字幕一区二区三区免费视频| 国产原创一区二区 | 国产午夜亚洲精品午夜鲁丝片 | 97人人澡人人爽人人模亚洲| 国产日韩欧美另类| 亚洲欧洲另类精品久久综合| 国产高清在线一区| 年轻bbwbbw高潮| 99国产精品9| 狠狠色很很在鲁视频| 亚洲国产精品激情综合图片| 亚洲精品www久久久| 91精品婷婷国产综合久久竹菊| 欧美日韩中文字幕一区二区三区 | 国产第一区在线观看| 一区二区三区毛片| 国产精品久久亚洲7777| 999久久国精品免费观看网站| 浪潮av网站| 精品国产精品亚洲一本大道 | 一区二区三区欧美在线| 夜夜躁日日躁狠狠久久av| 国产午夜精品一区二区三区欧美| 免费的午夜毛片| 日韩欧美精品一区二区| 日韩区欧美久久久无人区| 黄色香港三级三级三级| 国产极品美女高潮无套久久久| 午夜av电影院| 91社区国产高清| 久久99精品久久久久国产越南| 欧美激情国产一区| 午夜特级片| 欧美一区二区精品久久911| 亚洲午夜精品一区二区三区电影院| 高清人人天天夜夜曰狠狠狠狠| 亚洲精品suv精品一区二区| 国产欧美一区二区三区沐欲| 国产主播啪啪| 精品国产品香蕉在线| 亚洲精品色婷婷| 性视频一区二区三区| 久久午夜鲁丝片| av国产精品毛片一区二区小说| 97人人模人人爽人人喊小说| 2023国产精品自产拍在线观看| 国产精品女人精品久久久天天| 97久久精品一区二区三区观看| 黄色国产一区二区| 综合国产一区| 久久婷婷国产麻豆91天堂徐州| 午夜私人影院在线观看| 国产精品一区二区日韩新区| 久久精品男人的天堂| 国产88av| 国产一区二区午夜| 国产在线不卡一| 久久精品视频3| 欧美一区二区三区久久精品视 | 国产免费一区二区三区网站免费| 麻豆国产一区二区| 狠狠干一区| 99精品久久99久久久久| 国产69精品久久久久999小说| 国产欧美日韩va另类在线播放| 国产一级精品在线观看| 欧美精品日韩| 欧美国产精品久久| 伊人av综合网| 欧美一区二区激情三区| 国语精品一区| 福利片一区二区三区| 精品久久9999| 午夜亚洲国产理论片一二三四| 久久96国产精品久久99软件| 国模吧一区二区| 日本久久丰满的少妇三区| 国产精彩视频一区二区| 国产美女三级无套内谢| 国产二区免费视频| 四虎国产精品永久在线| 男女午夜爽爽| 精品一区二区三区中文字幕| 午夜片在线| 人人澡超碰碰97碰碰碰| 一色桃子av大全在线播放| 欧美亚洲另类小说| 国模一区二区三区白浆| 色噜噜日韩精品欧美一区二区| 久久久精品99久久精品36亚| 国产69精品久久99不卡解锁版| 538国产精品| 国产一区二区二| 日韩av免费网站| 片毛片免费看| 91精品黄色| 中文字幕一区二区三区免费| 国产精品天堂网| 欧美激情视频一区二区三区免费| 91精品婷婷国产综合久久竹菊 | 亚洲欧美精品suv| 国产一区二区麻豆| 亚洲无人区码一码二码三码| 久久国产精品欧美| 91国偷自产中文字幕婷婷| 国产日韩欧美三级| 欧美亚洲另类小说| 国产videosfree性另类| 国产一区二区精华| 国产精品久久久麻豆| 国产淫片免费看| 亚洲久久在线| 久爱精品视频在线播放| 销魂美女一区二区| 91片在线观看| 国产一区二区高清视频| 午夜剧场a级免费| 亚洲精品www久久久| 国产一区二三| 久久免费精品国产| 久久精品亚洲精品| 色婷婷综合久久久中文一区二区| 亚洲午夜久久久久久久久电影院| 国产91热爆ts人妖系列| 99久久免费精品国产男女性高好| 91精品久| 国产91视频一区| 久久精品一区二区三区电影| 99久久国产综合精品女不卡| 亚洲精品91久久久久久| 国产一区二| 精品久久一区| 国产日韩欧美亚洲综合| 国产区精品| 国产精品偷乱一区二区三区| 国产精品久久久爽爽爽麻豆色哟哟 | 黑人巨大精品欧美黑寡妇| 国产在线观看二区| 午夜看片网址| 国产一级片一区| 久久国产视屏| 四虎国产永久在线精品| 国产性生交xxxxx免费| 国产一区二区三区四| 特高潮videossexhd| 亚洲精品国产91| 亚洲精品国产setv| 日韩av在线影视| 中文在线一区二区三区| 91亚洲精品国偷拍| 中文字幕日韩一区二区| 国产黄一区二区毛片免下载 | 日韩在线一区视频| 欧美日韩一区二区三区69堂| 国产精品网站一区| 日本一区二区三区在线看| 欧美人妖一区二区三区| 精品国产18久久久久久依依影院| 国产一级不卡毛片| 欧美乱战大交xxxxx| 国产一区二区极品| 国产无遮挡又黄又爽又色视频| 精品国产一区二区三区免费| 日本一区二区免费电影| 狠狠色噜噜狠狠狠狠| 国产精品白浆视频| 国产极品美女高潮无套久久久| 精品无码久久久久国产| 国产一区日韩一区| 91在线一区二区| 色噜噜狠狠色综合影视| 国产一区免费在线观看| 天堂av色婷婷一区二区三区| 欧美日韩一区不卡| 热久久一区二区| 欧美一区二区三区免费看| 国产一卡在线| 日本一区欧美| 色婷婷久久一区二区三区麻豆 | 国产高清无套内谢免费| 97国产精品久久| 日本激情视频一区二区三区| 久久精品一二三| 欧美日韩国产色综合视频| av国产精品毛片一区二区小说| 国产精品亚洲一区二区三区| 午夜爽爽视频| 右手影院av| 久久久久久久国产| 51区亚洲精品一区二区三区| 小萝莉av| 国产日韩欧美精品一区二区 | 99精品视频免费看| 999国产精品999久久久久久| 国产一二三区免费| 欧美性受xxxx狂喷水| 欧美一区二区三区爽大粗免费| 久久免费精品国产| 亚洲v欧美v另类v综合v日韩v| 国模精品免费看久久久| 免费xxxx18美国| 国产区精品区| 一区二区欧美视频| 国产超碰人人模人人爽人人添| 精品国产一区二区三区麻豆免费观看完整版 | 中出乱码av亚洲精品久久天堂| 欧美乱妇高清无乱码免费| 国产日韩精品一区二区三区| 日韩欧美中文字幕精品| 国产精品一区二| 欧美在线一级va免费观看| 欧美一区二区三区久久精品视| 欧美久久久一区二区三区| 91精品福利在线| 亚洲欧美国产一区二区三区|