日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于模型不確定性與行為先驗的控制策略離線訓練方法在審

專利信息
申請號: 202310064893.5 申請日: 2023-02-06
公開(公告)號: CN115972211A 公開(公告)日: 2023-04-18
發明(設計)人: 章宗長;俞揚;周志華;周韌哲 申請(專利權)人: 南京大學
主分類號: B25J9/16 分類號: B25J9/16
代理公司: 南京樂羽知行專利代理事務所(普通合伙) 32326 代理人: 李玉平
地址: 210023 江蘇*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 模型 不確定性 行為 先驗 控制 策略 離線 訓練 方法
【權利要求書】:

1.一種基于模型不確定性與行為先驗的控制策略離線訓練方法,其特征在于,包括如下步驟:

步驟1:在機械臂裝配操作數據集上訓練集成動力學模型,所得模型可以模擬真實的機械臂操作環境;

步驟2:在機械臂裝配操作數據集上訓練變分自編碼器,所得行為先驗模型可以模擬采集這些數據的行為策略;

步驟3:開始訓練基于行為者-評論家的策略網絡,所述基于行為者-評論家的策略網絡為機械臂控制策略,控制策略與集成動力學模型交互生成機械臂的操作樣本,存入模型數據集中;

步驟4:從混合數據集中采樣小批量的機械臂操作樣本,計算樣本的模型不確定性與解碼器重構概率,并計算樣本的貝爾曼更新權重;

步驟5:使用采樣的小批量機械臂操作樣本來進行加權貝爾曼更新訓練值函數、目標值函數與控制策略;

步驟6:重復步驟3-5,控制策略訓練達到收斂后,完成訓練過程。

2.根據權利要求1所述的基于模型不確定性與行為先驗的控制策略離線訓練方法,其特征在于,對機械臂控制策略所要面對的機械臂操作環境進行建模得到集成動力學模型,機械臂控制策略可與集成動力學模型交互來擴充機械臂的數據集,并基于集成動力學模型誤差提供機械臂狀態-動作對的不確定性估計;

對采集機械臂離線數據的行為策略進行建模,得到行為先驗模型,行為先驗模型能提供機械臂狀態-動作對在行為策略下的出現概率;

基于行為者-評論家的策略網絡為需要學習的機械臂控制策略,在學習階段使用預先收集的機械臂離線數據集進行訓練,訓練過程采用的是加權貝爾曼更新,權重由集成動力學模型與行為先驗模型兩者共同構建。

3.根據權利要求1所述的基于模型不確定性與行為先驗的控制策略離線訓練方法,其特征在于,所述集成動力學模型由N個架構相同、初始化不同的全連接神經網絡表示,每個神經網絡用高斯分布建模,即輸入的是機械臂當前狀態s與動作a,輸出的是機械臂下一個狀態s′與獎勵r,其中代表高斯分布,φ代表神經網絡的參數,μ和Σ分別代表高斯分布的均值與標準差;集成動力學模型中的每個神經網絡基于以下最小化損失函數L(φ)進行訓練,所述最小化損失函數L(φ)的數學表達式為:

其中D是機械臂離線數據集,里面存儲有機械臂操作的經驗樣本,其中s,a,s′,r分別表示機械臂的運動狀態、執行動作、下一個狀態與獲得的獎勵。

4.根據權利要求1所述的基于模型不確定性與行為先驗的控制策略離線訓練方法,其特征在于,所述機械臂控制策略與集成動力學模型交互過程包括如下步驟:

步驟21:從機械臂離線數據集D中采樣一個狀態作為機械臂的當前狀態;

步驟22:機械臂的控制策略根據機械臂的當前狀態采樣一個動作;

步驟23:在動力學模型中隨機選取一個動力學模型,根據機械臂的當前狀態與動作生成機械臂的下一個狀態與獎勵;

步驟24:將下一個狀態作為機械臂的當前狀態,重復步驟22-23,直到達到給定的rollout長度,將所有生成的機械臂交互數據存入模型數據集中。

5.根據權利要求1所述的基于模型不確定性與行為先驗的控制策略離線訓練方法,其特征在于,每個機械臂的狀態-動作對(s,a)都能通過集成動力學模型來估計其不確定性u(s,a),計算公式如下:

其中表示第i個動力學模型輸出的高斯均值。

6.根據權利要求1所述的基于模型不確定性與行為先驗的控制策略離線訓練方法,其特征在于,動力學模型生成的機械臂操作數據中的獎勵都被施加一個不確定性懲罰,即以r-κu(s,a)來代替r,κ為超參數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310064893.5/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产91九色视频| 99精品久久久久久久婷婷| 国产黄色一区二区三区| 97人人模人人爽人人喊0| 欧美一区二区久久| 99国产精品欧美久久久久的广告| 国产亚洲精品久久yy50| 亚洲国产精品日韩av不卡在线 | 国模少妇一区二区三区| 国产福利一区在线观看| 国产视频一区二区视频| 欧美乱妇高清无乱码一级特黄| av不卡一区二区三区| 欧美在线一区二区视频| 色妞www精品视频| xxxx18hd护士hd护士| 一区二区中文字幕在线观看| 日本白嫩的18sex少妇hd| 亚洲四区在线| 97精品国产97久久久久久| 久久乐国产精品| 午夜剧场一级片| 精品国产区一区二| 日本精品99| 97欧美精品| 一区二区三区欧美视频| 国产日韩欧美二区| 男女无遮挡xx00动态图120秒| 艳妇荡乳欲伦2| 午夜大片男女免费观看爽爽爽尤物| 国模精品免费看久久久| 国产1区2区3区| 日本午夜一区二区| 国产第一区二区三区| 精品国产九九| 999亚洲国产精| 久久久久久亚洲精品中文字幕| 国产大学生呻吟对白精彩在线| 理论片午午伦夜理片在线播放| 国产视频一区二区视频| 国产一级片一区| 久久91久久久久麻豆精品| 国产精品偷拍| 欧美一区二区三区在线视频观看| 一区二区三区欧美视频| 精品91av| 亚洲精品www久久久| 精品少妇一区二区三区免费观看焕| 色噜噜狠狠狠狠色综合久| 午夜影院黄色片| 综合久久色| 精品国产1区2区| 国产精品九九九九九九九| 日韩一区高清| 国产精品日韩在线观看| 亚洲欧美一区二区三区不卡| 亚洲日本国产精品| 日本一二三区视频在线| 国产区二区| 国产九九九精品视频| 国产白丝一区二区三区| 9999国产精品| 国产高清在线一区| 亚洲精品日日夜夜| 国产日韩欧美精品| 精品亚洲午夜久久久久91| 国产偷自视频区视频一区二区| 日日噜噜夜夜狠狠| 久久国产中文字幕| 在线播放国产一区| 久久久久久国产一区二区三区| 久久福利免费视频| 亚洲精品性| 国产一区在线免费观看| 国产精品自拍不卡| 国产伦精品一区二区三区电影| 国产呻吟久久久久久久92| 国产一区二区三区网站| 日日夜夜精品免费看| 久久久久久亚洲精品| 国产一区二区极品| 国产精品你懂的在线| 亚洲国产精品一区在线| 精品国产一区二区三区麻豆免费观看完整版 | 国产69久久久欧美一级| 久久国产精品99国产精| 国产精品午夜一区二区| 国产一区二区在| 91一区二区三区久久国产乱| 国产在线一二区| 激情久久久| 国产一区二区黄| xxxxx色| 亚洲精品久久久久不卡激情文学| 91久久精品在线| 亚洲精品www久久久久久广东 | 欧美日韩激情一区二区| 免费超级乱淫视频播放| 欧美精品第一区| 国产欧美日韩在线观看| 久久一区二区精品| 欧美一区视频观看| 午夜伦理在线观看| 国产91九色视频| 精品国产一区二区三区麻豆免费观看完整版 | 久久久久久久亚洲视频| 精品久久小视频| 欧美精品一区二区性色| 国产乱xxxxx国语对白| 久久一级精品视频| 日日夜夜一区二区| 欧美性二区| 国产91色综合| 久久99精品国产麻豆婷婷洗澡 | 国产精品乱综合在线| 国产一区二区三区小说| 国产日韩欧美三级| 九九国产精品视频| 日韩精品久久久久久久的张开腿让 | 一区二区三区国产精华| 国产欧美亚洲一区二区| 亚洲欧洲国产伦综合| 日本一二三区视频| 精品国产1区2区| 国产精品一二三四五区| 久久久久久国产精品免费| 亚洲精品国产主播一区| 欧美午夜看片在线观看字幕| 精品国产伦一区二区三区| 国产1区2区3区中文字幕| 久久精品国语| 欧美一区二区久久久| 国产乱xxxxx国语对白| 国产一区二区综合| 久久久精品欧美一区二区免费| 国产视频精品久久| 91久久国产露脸精品国产| 亚洲欧洲另类精品久久综合| 狠狠插狠狠干| 偷拍精品一区二区三区| 日本一区二区电影在线观看 | 久久久综合亚洲91久久98| 国产videosfree性另类| 国产精品九九九九九| 亚洲乱码一区二区三区三上悠亚 | 国产一区午夜| 日韩精品一区二区三区在线 | 91一区二区三区在线| 日韩av不卡一区| 精品国产乱码久久久久久久久 | 国语精品一区| 国产精品日产欧美久久久久| 色午夜影院| 欧美一区久久久| 国产九九九精品视频| 欧美一区二区三区另类| 中文字幕一区二区三区乱码| 91精品资源| 99久久夜色精品| 国产69精品久久久久孕妇不能看| 国产一区二区片| 97久久精品人人做人人爽50路| 四季av中文字幕一区| 久久精品国产色蜜蜜麻豆| 亚洲欧美一卡| 久久精品手机视频| 久久99精品国产麻豆宅宅| 国产欧美日韩另类| 精品一区二区超碰久久久| 久久国产精品波多野结衣| 日韩精品一区二区三区免费观看| 精品美女一区二区三区| 一区二区三区电影在线观看| 日本一二三区视频在线| 精品国产一区二区在线| 精品999久久久| 久久综合久久自在自线精品自| 国产精品自拍在线| 久久九精品| 国产一区二区麻豆| 久久影视一区二区| 国产精品视频一区二区三| 精品亚洲午夜久久久久91| 午夜爽爽视频| 国产乱子一区二区| 日本aⅴ精品一区二区三区日| 正在播放国产一区二区| 91精品婷婷国产综合久久竹菊 | 国产1区2区3区| 中文字幕区一区二| 中文字幕亚洲欧美日韩在线不卡| 久久久精品视频在线| 亚洲精品国产91| 久久久久国产亚洲| 日韩中文字幕亚洲欧美| 日本美女视频一区二区三区| 久久久久国产精品www| 挺进警察美妇后菊| 国产亚洲精品综合一区| 亚欧精品在线观看| 2020国产精品自拍| 精品少妇一区二区三区 | 一级女性全黄久久生活片免费| 亚洲精欧美一区二区精品| 国产97在线播放| 久久午夜精品福利一区二区| 日本黄页在线观看| 国产精品久久久久久久妇女| 国产精品v一区二区三区| 99精品视频一区| 国产精品剧情一区二区三区| 精品国产乱码久久久久久影片| 国产视频一区二区在线播放| 国产aⅴ精品久久久久久| 视频一区二区中文字幕| 国产精品国外精品| 国产精品中文字幕一区二区三区 | 处破大全欧美破苞二十三| 满春阁精品av在线导航| 91波多野结衣| 国产69久久久欧美一级| 午夜一区二区视频| 国产一区网址| 国产97在线看| 亚洲四区在线| 国产91在| 亚洲欧洲日韩| 色午夜影院| 午夜国产一区| 福利片午夜| 四季av中文字幕一区| 久99久精品| 国产午夜精品理论片| 国产欧美一区二区精品婷| 久久精品国产99| 99久久久国产精品免费调教网站| 高清在线一区二区| 国产在线精品一区| 亚日韩精品| 狠狠躁夜夜躁| 国产理论一区二区三区| 色婷婷噜噜久久国产精品12p| 国产一区二区三区大片| 国产精品奇米一区二区三区小说| 欧美精品日韩| 综合国产一区|