日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于DDGPES的機(jī)器人控制方法在審

專利信息
申請?zhí)枺?/td> 201911351334.2 申請日: 2019-12-24
公開(公告)號: CN110919659A 公開(公告)日: 2020-03-27
發(fā)明(設(shè)計(jì))人: 王紅濱;原明旗;何鳴;張?jiān)?/a>;周連科;王念濱;張毅 申請(專利權(quán))人: 哈爾濱工程大學(xué)
主分類號: B25J9/16 分類號: B25J9/16
代理公司: 哈爾濱市松花江專利商標(biāo)事務(wù)所 23109 代理人: 時(shí)起磊
地址: 150001 黑龍江*** 國省代碼: 黑龍江;23
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 ddgpes 機(jī)器人 控制 方法
【權(quán)利要求書】:

1.一種基于DDGPES的機(jī)器人控制方法,具體包括以下步驟:

將機(jī)器人的控制決策系統(tǒng)記為智能體Agent;

針對Agent,利用DQN網(wǎng)絡(luò)進(jìn)行決策,進(jìn)而實(shí)現(xiàn)機(jī)器人進(jìn)行控制;

其特征在于,DQN網(wǎng)絡(luò)中,采用DDES探索利用策略確定損失函數(shù)LD

LD=L-Eπ′∈Π′[αD(π,π′)]

其中,L表示為DRL算法中用于更新當(dāng)前策略網(wǎng)絡(luò)的損失函數(shù);π是Agent當(dāng)前的策略,π′是有限策略集合Π′的一個(gè)樣本,D(π,π′)是π和π′之間的度量距離,α是D的比例因子,E[·]表示期望,Eπ′∈Π′[·]表示π′∈Π′條件下對應(yīng)的E[·];

在利用DQN網(wǎng)絡(luò)進(jìn)行決策時(shí),使用波爾茲曼策略選擇行動(dòng),包括以下步驟:

生成隨機(jī)數(shù),判斷隨機(jī)數(shù)與概率ε的大小;

當(dāng)隨機(jī)數(shù)大于等于概率ε時(shí),計(jì)算并判斷是否達(dá)到目標(biāo)狀態(tài);其中,Q(·)為Q函數(shù),表示某一刻狀態(tài)下采用動(dòng)作能夠獲得收益的期望值;ai表示當(dāng)前狀態(tài)s下所有可以選擇的動(dòng)作,i=1,2,3…;A為當(dāng)前狀態(tài)s下所有可以選擇的動(dòng)作的集合;

所述概率ε為ε-greedy策略中ε參數(shù),具體為其中,D為環(huán)比增長率,difference=Qmaxt(s,ai)-Qmaxt-1(s,ai),Qmaxt(s,ai)為狀態(tài)動(dòng)作對(s,ai)當(dāng)前時(shí)間步下的最大收益的期望值,Qmaxt-1(s,ai)為狀態(tài)動(dòng)作對(s,ai)上一時(shí)間步對應(yīng)的最大收益的期望值;

否則,計(jì)算根據(jù)p(s,ai)執(zhí)行動(dòng)作;然后判斷是否達(dá)到目標(biāo)狀態(tài),并更新difference。

2.根據(jù)權(quán)利要求1所述的一種基于DDGPES的機(jī)器人控制方法,其特征在于,所述度量距離D(π,π′)使用KL-divergence距離。

3.根據(jù)權(quán)利要求1或2所述的一種基于DDGPES的機(jī)器人控制方法,其特征在于,所述的L=Es,a,r,s′[(y-Q(s,a;θ))2],其中,s為機(jī)器人的狀態(tài),a為機(jī)器人的動(dòng)作,θ為網(wǎng)絡(luò)參數(shù),Q(·)為Q函數(shù),表示某一刻狀態(tài)下采用動(dòng)作能夠獲得收益的期望;y是DDPG中利用target策略網(wǎng)絡(luò)μ′和target Q網(wǎng)絡(luò)Q′得到的計(jì)算結(jié)果;r為獎(jiǎng)勵(lì)值,s′為轉(zhuǎn)移后的狀態(tài),E[·]表示期望,Es,a,r,s′[·]為s,a,r,s′條件下對應(yīng)的E[·]。

4.一種基于DDGPES的機(jī)器人控制方法,具體包括以下步驟:

步驟一、初始化:當(dāng)前值網(wǎng)絡(luò)Q與目標(biāo)值網(wǎng)絡(luò)Q′的權(quán)重分別為θ與θ′,經(jīng)驗(yàn)回放池E通過智能體Agent與環(huán)境交互存儲樣本序列,二級優(yōu)先級初始化臨時(shí)經(jīng)驗(yàn)回放池為空,并構(gòu)建用于存儲單個(gè)樣本序列的經(jīng)驗(yàn)回放池h;

步驟二、將當(dāng)前狀態(tài)Sm輸入當(dāng)前值網(wǎng)絡(luò)Q,m=1,2,…,t;

利用探索利用策略GBES選擇Agent執(zhí)行的動(dòng)作Am,根據(jù)當(dāng)前狀態(tài)Sm和動(dòng)作Am獲得即時(shí)獎(jiǎng)賞Rm和狀態(tài)Sm+1;將樣本數(shù)據(jù)<Sm;Am;Sm+1;Rm>存儲到經(jīng)驗(yàn)回放池h中,并賦予當(dāng)前經(jīng)驗(yàn)回放池中最大的優(yōu)先級為代表第m個(gè)樣本數(shù)據(jù)的優(yōu)先級;

探索利用策略GPES選擇Agent執(zhí)行的動(dòng)作Am的過程如下:

生成隨機(jī)數(shù),判斷隨機(jī)數(shù)與概率ε的大小;

當(dāng)隨機(jī)數(shù)大于等于概率ε時(shí),計(jì)算并判斷是否達(dá)到目標(biāo)狀態(tài);其中,Q(·)為Q函數(shù),表示某一刻狀態(tài)下采用動(dòng)作能夠獲得收益的期望值;ai表示當(dāng)前狀態(tài)s下所有可以選擇的動(dòng)作,i=1,2,3…;A為當(dāng)前狀態(tài)s下所有可以選擇的動(dòng)作的集合;

所述概率ε為ε-greedy策略中ε參數(shù),具體為其中,D為環(huán)比增長率,difference=Q maxt(s,ai)-Q maxt-1(s,ai),Q maxt(s,ai)為狀態(tài)動(dòng)作對(s,ai)當(dāng)前時(shí)間步下的最大收益的期望值,Q maxt-1(s,ai)為狀態(tài)動(dòng)作對(s,ai)上一時(shí)間步對應(yīng)的最大收益的期望值;

否則,計(jì)算根據(jù)p(s,ai)執(zhí)行動(dòng)作;然后判斷是否達(dá)到目標(biāo)狀態(tài),并更新difference;

步驟三、判斷狀態(tài)St是否達(dá)到中止?fàn)顟B(tài),若狀態(tài)St達(dá)到中止?fàn)顟B(tài),將經(jīng)驗(yàn)回放池h中樣本數(shù)據(jù)組成的樣本序列l(wèi)1={<S1;A1;S2;R1>,<S2;A2;S3;R2>,…,<St;At;St+1;Rt>}保存到經(jīng)驗(yàn)回放池E中,并清空經(jīng)驗(yàn)回放池h,執(zhí)行步驟十二;

步驟四、若狀態(tài)St未達(dá)到中止?fàn)顟B(tài),則判斷是否滿足t%K=0,其中:t%K=0表示t對K取余等于0,K為訓(xùn)練頻率;

若不滿足t%K=0,則執(zhí)行步驟十和步驟十一;

若滿足t%K=0,則計(jì)算出經(jīng)驗(yàn)回放池E中包含的樣本序列的數(shù)量M,并執(zhí)行步驟五至步驟十一;

步驟五、分別計(jì)算出經(jīng)驗(yàn)回放池E中每個(gè)樣本序列的累計(jì)獎(jiǎng)賞值,根據(jù)每個(gè)樣本序列的累計(jì)獎(jiǎng)賞值計(jì)算出每個(gè)樣本序列的優(yōu)先級;

步驟六、分別根據(jù)步驟五計(jì)算出的每個(gè)樣本序列的優(yōu)先級來計(jì)算每個(gè)樣本序列被采樣的概率;

步驟七、根據(jù)步驟六計(jì)算出的每個(gè)樣本序列被采樣的概率,對經(jīng)驗(yàn)回放池E中的樣本序列進(jìn)行采樣,將采樣出來的樣本序列放入臨時(shí)經(jīng)驗(yàn)回放池中,得到臨時(shí)經(jīng)驗(yàn)回放池中含有的樣本數(shù)據(jù)的個(gè)數(shù)

步驟八、計(jì)算步驟七臨時(shí)經(jīng)驗(yàn)回放池中每個(gè)樣本數(shù)據(jù)的采樣概率,根據(jù)每個(gè)樣本數(shù)據(jù)的采樣概率,從臨時(shí)經(jīng)驗(yàn)回放池的個(gè)樣本數(shù)據(jù)中抽取出k個(gè)樣本數(shù)據(jù);

再計(jì)算每個(gè)抽取出的樣本數(shù)據(jù)的采樣重要性系數(shù)ωe以及TD-errorδe,根據(jù)TD-errorδe計(jì)算出每個(gè)抽取出的樣本數(shù)據(jù)的優(yōu)先級;

根據(jù)每個(gè)抽取出的樣本數(shù)據(jù)在經(jīng)驗(yàn)回放池中的樣本序列中的位置,進(jìn)行反向更新優(yōu)先級;

從經(jīng)驗(yàn)回放池的策略集合Π中抽取策略π′,計(jì)算Eπ′∈Π′[αD(π,π′)];

根據(jù)采樣重要性系數(shù)ωe和TD-errorδe計(jì)算每個(gè)抽取出的樣本數(shù)據(jù)的累計(jì)梯度;計(jì)算累計(jì)的過程采用DDES策略進(jìn)行,LD=L-Eπ′∈Π′[αD(π,π′)];

步驟九、根據(jù)步驟八計(jì)算出的累計(jì)梯度更新當(dāng)前值網(wǎng)絡(luò)Q的權(quán)重θ;

步驟十、當(dāng)t%L=0時(shí),更新目標(biāo)值網(wǎng)絡(luò)Q′的權(quán)重為:當(dāng)前值網(wǎng)絡(luò)Q的當(dāng)前權(quán)重;其中:L為目標(biāo)值網(wǎng)絡(luò)Q′的權(quán)重更新頻率;

步驟十一、令Sm=Sm+1,重復(fù)執(zhí)行步驟二至步驟十一,如此循環(huán),直至達(dá)到設(shè)置的最大迭代次數(shù)時(shí)停止執(zhí)行,獲得訓(xùn)練好的當(dāng)前值網(wǎng)絡(luò)Q與目標(biāo)值網(wǎng)絡(luò)Q′;

步驟十二、本次指揮決策過程結(jié)束,將Sm設(shè)置初始狀態(tài)進(jìn)行下一次指揮決策過程。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工程大學(xué),未經(jīng)哈爾濱工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201911351334.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 一区二区三区免费高清视频| 久久免费精品国产| 538国产精品一区二区| 午夜精品一区二区三区在线播放| 激情欧美一区二区三区| 激情久久一区二区三区| 日韩午夜毛片| 欧美中文字幕一区二区三区| 国内久久久| 久久久久亚洲国产精品| 免费观看黄色毛片| 日韩午夜毛片| 淫片免费看| 国产一区二区国产| 日韩美一区二区三区| 精品国精品国产自在久不卡| 中出乱码av亚洲精品久久天堂| 国产精品久久久麻豆| 欧美一区二区三区免费播放视频了| 国产伦精品一区二区三区免费观看| 国产精品综合在线观看| 91超薄丝袜肉丝一区二区| 午夜免费网址| 亚洲欧洲日韩在线| 亚洲码在线| 亚洲国产偷| 亚洲精品国产精品国产| 国产精品高潮呻吟视频| 8x8x国产一区二区三区精品推荐| 午夜一区二区视频| 国产一区二区激情| 91av精品| 国产欧美日韩精品一区二区图片 | 亚洲乱码av一区二区三区中文在线: | 国产精品理人伦一区二区三区| 欧美一区二区三区性| 少妇又紧又色又爽又刺激视频网站| 久久99精品国产一区二区三区| 日韩av免费电影| 欧美亚洲精品一区二区三区| 国产精品一区二区三区在线看| 欧美日韩一级黄| 天干天干天啪啪夜爽爽99| 国产99久久九九精品| 日本午夜精品一区二区三区| 在线播放国产一区| 国产精品一区二区av麻豆| 国产免费区| 黄毛片在线观看| 国产99视频精品免费视频7| 国产精品5区| 高清欧美精品xxxxx| 综合在线一区| 国产欧美一区二区在线| 欧美色综合天天久久综合精品| 蜜臀久久久久久999| 国产69精品久久99不卡解锁版| 久久精品手机视频| 国产精品中文字幕一区| 久久国产欧美一区二区三区免费| 欧洲激情一区二区| 91精品国产综合久久国产大片| 国产欧美精品一区二区三区小说 | 四虎国产精品永久在线国在线| 国产精品19乱码一区二区三区| 国产精自产拍久久久久久蜜| 91一区在线| 久久久一区二区精品| 欧美一区二区三区免费视频| 99久久国产综合精品女不卡| 黄色av免费| 亚洲一级中文字幕| 国产欧美一区二区在线观看| 精品国产乱码久久久久久a丨| 久久国产精品欧美| 夜夜躁狠狠躁日日躁2024| 欧美日韩一区二区三区四区五区六区| av国产精品毛片一区二区小说| 一区二区久久精品66国产精品| 97人人澡人人爽人人模亚洲 | 午夜a电影| 亚洲一卡二卡在线| 欧美日韩国产一区在线| 色吊丝av中文字幕| 夜色av网| 91理论片午午伦夜理片久久| 日本美女视频一区二区| 欧美日韩一区电影| 夜夜嗨av色一区二区不卡| 国产一区二区黄| 亚洲国产精品97久久无色| 丰满岳乱妇bd在线观看k8 | 久久一级精品视频| 91丝袜国产在线播放| 国产91在线拍偷自揄拍| 国产日韩欧美在线影视| 91狠狠操| 国产精品久久久久久久四虎电影| 精品免费久久久久久久苍| 国产一二区在线| 国产二区免费| 国产精品美女久久久另类人妖| 欧美一区二区三区免费观看视频| 热久久国产| 狠狠色噜噜狠狠狠狠米奇777| 国产电影一区二区三区下载| 2018亚洲巨乳在线观看| 国产日韩欧美精品一区| 欧美一区免费| 国产精品一区二区三| 国产69精品久久久久9999不卡免费| 狠狠色狠狠色综合日日五| 日韩精品中文字幕一区| 久久久久久久亚洲视频| 国产欧美日韩二区| 精品一区二区三区中文字幕| 中文字幕亚洲欧美日韩在线不卡| 国产97久久| 国产精品一二三区免费| 99国精视频一区一区一三| 午夜欧美影院| 精品一区二区三区自拍图片区| 久久99精品国产麻豆宅宅| 性国产日韩欧美一区二区在线| 国产伦精品一区二区三区免费迷| 欧美性xxxxx极品少妇| 99久久国产综合精品麻豆| 日韩精品一区在线视频| 国产www亚洲а∨天堂| 久久一区欧美| 国模少妇一区二区三区| 欧美一区二区免费视频| 久久国产激情视频| 久久国产麻豆| 999久久久国产精品| 日韩一级免费视频| 国产亚洲精品久久久久动| 一区二区三区免费高清视频| 91久久香蕉| 欧美一区视频观看| 99精品欧美一区二区三区美图| 日本美女视频一区二区三区| 香港三日本8a三级少妇三级99| 国产精品偷伦一区二区| 亚洲五码在线| 国产精品久久久久久久久久久久久久不卡 | 最新国产精品自拍| 国产一卡在线| 一区二区精品在线| 男人的天堂一区二区| 91精品色| 色噜噜狠狠色综合久| 99riav3国产精品视频| 国产亚洲精品久久久久久网站| 精品国产一区二区三区久久久久久 | 一区二区久久久久| 91精品国产综合久久福利软件| 91麻豆精品一区二区三区| 久久精品国产精品亚洲红杏| 国产午夜精品一区二区三区视频| 91久久精品久久国产性色也91| 爽妇色啪网| 亚洲精品一区二区三区98年| 正在播放国产一区二区| 国产精品日韩一区二区| 亚洲欧美制服丝腿| 国产69精品福利视频| 国产一区二区三区国产| 99视频一区| 国产性猛交96| 免费毛片**| 激情久久久久久| 丰满少妇高潮惨叫久久久一| xxxx国产一二三区xxxx| 天啦噜国产精品亚洲精品| 久久97国产| 久久久久久久国产| 99久精品视频| 大伊人av| freexxxx性| 高清国产一区二区 | 精品久久二区| 国产69精品久久久久9999不卡免费 | 国产精品丝袜综合区另类| 国产一区二区伦理| 91精品婷婷国产综合久久竹菊| 亚洲欧美日韩三区| 久久中文一区| 国产综合久久精品| 国产主播啪啪| 夜夜躁日日躁狠狠躁| 国产1区在线观看| 久久九精品| 自偷自拍亚洲| 亚洲欧美制服丝腿| 国产精彩视频一区二区| av午夜在线观看| 色乱码一区二区三在线看| 日本一区二区欧美| 国产一区二区三区在线电影| 日韩av在线影院| 狠狠干一区| 国产午夜精品一区| 午夜影院毛片| 国产精品一区亚洲二区日本三区| 91高清一区| 91国产一区二区| 91精品中综合久久久婷婷| 色一情一乱一乱一区免费网站| 久久综合国产伦精品免费| 视频一区二区中文字幕| 亚洲精品国产一区二| 欧美一区二区三区四区在线观看| 国内少妇偷人精品视频免费| 国产一区二区三区国产| 中文字幕一区二区三区日韩精品| 欧美精品六区| 激情欧美日韩| 欧美精品二区三区| 久久69视频| 午夜精品一二三区| 91精品色| 一级女性全黄久久生活片免费| 午夜看大片| 亚洲精品中文字幕乱码三区91| 国产69精品久久久久久久久久| 窝窝午夜理伦免费影院| 97国产精品久久| 欧美精品六区| 午夜叫声理论片人人影院| 日本伦精品一区二区三区免费| 国产色99| 国产二区不卡| 亚洲精品一品区二品区三品区| 日本高清不卡二区| 国产精品1234区| 99日韩精品视频| 午夜黄色网址| 久久噜噜少妇网站| 国v精品久久久网| 亚洲第一天堂久久| 午夜a电影| 国产午夜亚洲精品午夜鲁丝片| 亚洲精品国产一区二区三区| 欧美日韩一级二级三级| 91精品久久久久久久久久|