日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于雙評論家強(qiáng)化學(xué)習(xí)技術(shù)的水下航行器目標(biāo)區(qū)域上浮控制方法有效

專利信息
申請?zhí)枺?/td> 202110262597.7 申請日: 2021-03-11
公開(公告)號: CN113033119B 公開(公告)日: 2022-03-25
發(fā)明(設(shè)計(jì))人: 李沂濱;張?zhí)鞚?/a>;繆旭弘;魏征;尤岳;周廣禮;賈磊;莊英豪;宋艷 申請(專利權(quán))人: 山東大學(xué)
主分類號: G06F30/28 分類號: G06F30/28;G06N3/04;G06N3/08;B63G8/18;B63G8/14
代理公司: 濟(jì)南金迪知識產(chǎn)權(quán)代理有限公司 37219 代理人: 王楠
地址: 250199 山*** 國省代碼: 山東;37
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 評論家 強(qiáng)化 學(xué)習(xí) 技術(shù) 水下 航行 目標(biāo) 區(qū)域 上浮 控制 方法
【說明書】:

發(fā)明涉及一種基于雙評論家強(qiáng)化學(xué)習(xí)技術(shù)的水下航行器目標(biāo)區(qū)域上浮控制方法,屬于海洋控制實(shí)驗(yàn)技術(shù)領(lǐng)域,基于深度強(qiáng)化學(xué)習(xí)中的DDPG算法框架,在水下航行器智能體訓(xùn)練過程中既使用先前得到的專家數(shù)據(jù),又使用智能體與任務(wù)環(huán)境交互得到的交互數(shù)據(jù),兩者混合采集,大大提升了算法收斂速度。同時(shí),本發(fā)明利用兩組彼此獨(dú)立的評論家網(wǎng)絡(luò),通過取兩者分別輸出Q(s,a)的最小值得到演員網(wǎng)絡(luò)的損失函數(shù),有效降低了強(qiáng)化學(xué)習(xí)算法中存在的過偏估計(jì)。

技術(shù)領(lǐng)域

本發(fā)明涉及一種基于雙評論家強(qiáng)化學(xué)習(xí)技術(shù)的水下航行器目標(biāo)區(qū)域上浮控制方法,屬于海洋控制實(shí)驗(yàn)技術(shù)領(lǐng)域。

背景技術(shù)

水下航行器作為關(guān)鍵的海洋裝備,廣泛的被應(yīng)用于海洋的地形測繪、資源勘探、考古調(diào)查、管道維護(hù)、生物監(jiān)測等諸多科研及工程領(lǐng)域,是人類探索海洋的重要手段。然而,海底環(huán)境復(fù)雜多變,水下航行器工作在這樣的環(huán)境中,當(dāng)遭遇故障或強(qiáng)干擾時(shí),若不能及時(shí)、安全、智能地上浮至母船所在區(qū)域,勢必會導(dǎo)致經(jīng)濟(jì)損失及重要數(shù)據(jù)遺失。因此,為了增強(qiáng)水下航行器在海底復(fù)雜環(huán)境下的適應(yīng)能力、提升水下航行器智能決策可靠性,開展針對水下航行器目標(biāo)區(qū)域智能上浮控制算法的研究是十分必要的。

然而實(shí)現(xiàn)水下航行器智能化控制仍然有很多困難點(diǎn)。傳統(tǒng)的例如比例積分微分(PID)控制器等線性控制器,對于水下航行器這類具有復(fù)雜非線性動力學(xué)特性的系統(tǒng),難以取得良好的控制性能。即便使用現(xiàn)有的非線性控制器,在實(shí)際的任務(wù)環(huán)境中水下航行器動態(tài)模型及任務(wù)環(huán)境模型都難以精確獲取,所以也難以獲得良好的控制效果(Hui Wu etal.,“Depth Control of Model-Free AUVs via Reinforcement Learning”,IEEETransactions on Systems,Man,and Cybernetics:Systems,Vol.49,pp.2499-2510,Dec.2019)。此外,復(fù)雜多變的洋流、懸浮于水中或海面的障礙物都會對水下航行器的目標(biāo)區(qū)域上浮控制帶來干擾。所以需要一種可以不依賴于模型且能夠進(jìn)行自學(xué)習(xí)的智能控制算法來解決上述問題。

機(jī)器學(xué)習(xí)技術(shù)近些年的快速發(fā)展給水下航行器智能化控制帶來更多可能。強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)作為一種可以解決無模型馬爾可夫決策過程(Markovdecision process,MDP)問題的算法框架,能夠構(gòu)建一個(gè)與海底任務(wù)環(huán)境不斷交互的水下航行器智能體,在無任務(wù)環(huán)境模型的情況下通過獲取來自任務(wù)環(huán)境反饋的懲罰或獎(jiǎng)勵(lì),最大化累積獎(jiǎng)勵(lì)來最終尋找到完成任務(wù)的最優(yōu)策略,如圖1所示。

然而,現(xiàn)有基于傳統(tǒng)RL進(jìn)行水下航行器控制的研究及發(fā)明存在著一些顯著的缺陷:首先,基于傳統(tǒng)強(qiáng)化學(xué)習(xí)如Q-learning等算法,需要構(gòu)建一張尺寸巨大的Q值表以存儲高緯度的動作空間、狀態(tài)空間中存在的Q(s,a)值,而隨著智能體在高維度的動作、狀態(tài)空間中的不斷訓(xùn)練,Q值表內(nèi)的Q值個(gè)數(shù)會爆炸式增長,使得該方法有很大局限性。而后,隨著谷歌Deepmind團(tuán)隊(duì)提出的將深度學(xué)習(xí)與傳統(tǒng)Q-learning技術(shù)結(jié)合而誕生的深度強(qiáng)化學(xué)習(xí)算法DRL(Deep reinforcement learning)算法,該算法中Q值表被神經(jīng)網(wǎng)絡(luò)代替而成為DQN(Deep Q Net)(V.Mnih et al.,“Human-level control through deep reinforcementlearning,”Nature,vol.518,pp.529-533,2015.),但DQN算法只適用于離散動作空間,制約其應(yīng)用于水下航行器智能化控制;DDPG(Deep Deterministic Policy Gradient)(Lillicrap T P,Hunt J J,Pritzel A,et al.Continuous control with deepreinforcement learning[J].Computer ence,2015,8(6):A187.)是一種適用于連續(xù)動作空間的控制算法,但其中的評論家網(wǎng)絡(luò)輸出的Q(s,a)來自于動作-價(jià)值函數(shù)的期望,導(dǎo)致其存在過高估計(jì)的弊端。并且,以上RL方法并未考慮容易獲取且性能可靠的專家數(shù)據(jù),導(dǎo)致算法在訓(xùn)練收斂速度過慢,且在訓(xùn)練初期存在很大隨機(jī)性。

發(fā)明內(nèi)容

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東大學(xué),未經(jīng)山東大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110262597.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产伦精品一区二区三区免费迷| 综合国产一区| 国产精品久久久久免费a∨大胸| 久久久精品久久日韩一区综合| 精品99免费视频| 二区三区免费视频| 亚洲欧美另类综合| 国产欧美性| 亚洲乱亚洲乱妇50p| 久久久国产精品一区| 国产一区免费在线| 国产乱码精品一区二区三区介绍| 亚洲欧美另类久久久精品2019| 精品少妇一区二区三区免费观看焕| 日韩精品一二区| 国产69精品久久777的优势| 欧美精品久| 91精品夜夜| 精品久久不卡| 日韩av电影手机在线观看| 午夜精品在线观看| 久久中文一区二区| 99国产精品久久久久| 精品中文久久| 91久久国产视频| 一级久久久| 99久久免费精品国产免费高清| 一区二区三区四区视频在线| 97人人澡人人爽91综合色| 午夜激情看片| 强制中出し~大桥未久10| 色吊丝av中文字幕| 年轻bbwwbbww高潮| 999久久久国产精品| 天啦噜国产精品亚洲精品| 精品久久久久久中文字幕大豆网| 97人人模人人爽视频一区二区| 丰满岳妇伦4在线观看| 国产精品一区二区免费 | 亚洲一区欧美| 97久久国产精品| 国产一级一区二区| 狠狠色噜狠狠狠狠| 国产精品久久久久久久新郎| 久久黄色精品视频| 国产乱了高清露脸对白| 一区二区在线精品| 国产精品视频久久久久| 午夜av免费看| 亚洲在线久久| 欧美一区二区三区免费电影| 久久99国产综合精品| 精品国产免费久久| 色综合欧美亚洲国产| 国产一区二区视频播放| 欧美国产精品久久| 久久免费福利视频| 日韩av一区不卡| 99精品在免费线偷拍| 满春阁精品av在线导航| 国产一区二区三级| 国产精品偷乱一区二区三区| 十八无遮挡| 欧美激情视频一区二区三区免费| 日本午夜一区二区| 一区二区三区欧美在线| 中文字幕天天躁日日躁狠狠躁免费| 狠狠色狠狠综合久久| 狠狠躁夜夜躁2020| 国内偷拍一区| 国产精品天堂网| 久久午夜鲁丝片| 97国产精品久久| 国产精品色在线网站| 又黄又爽又刺激久久久久亚洲精品 | 狠狠色很很在鲁视频| 激情aⅴ欧美一区二区三区| 国内少妇偷人精品视频免费| 国产一区二区精品免费 | 一区二区中文字幕在线观看| 国精产品一二四区在线看 | 国产精品一二三区视频出来一| 久久精品国产亚| 性欧美1819sex性高播放| 午夜电影院理论片做爰| 2023国产精品自产拍在线观看| 国产精选一区二区| 日韩在线一区视频| 国产精品久久久久四虎| 强制中出し~大桥未久10在线播放| 国产精品丝袜综合区另类| 日韩精品中文字幕一区二区三区| 国产精品日韩视频| 欧美日韩国产精品一区二区三区| 色婷婷综合久久久久中文| 精品国产仑片一区二区三区| 中文字幕a一二三在线| 国产1区2| 日本护士hd高潮护士| 午夜电影一区二区| 91精品视频在线观看免费| 中文字幕一区三区| 国产精品电影一区二区三区| 久久国产视屏| 国产精品日韩电影| 国产乱老一区视频| 国产的欧美一区二区三区| 国产精品麻豆一区二区三区| 中文字幕在线乱码不卡二区区| 狠狠色噜噜狠狠狠狠奇米777| 久久久久久国产一区二区三区| 欧美在线视频一区二区三区| 天摸夜夜添久久精品亚洲人成| 国产精品国产一区二区三区四区| 国产91丝袜在线播放动漫| 国产精品久久久区三区天天噜| 激情aⅴ欧美一区二区三区| 91中文字幕一区| 国产一区二| 亚洲欧美国产一区二区三区| 国产在线精品一区二区| 国产乱码一区二区三区| 国产天堂第一区| 亚洲激情中文字幕| 少妇高潮大叫喷水| 欧美日韩一区二区高清| 99re热精品视频国产免费| 亚洲欧美一卡| 国产一区日韩一区| 自偷自拍亚洲| 91一区在线| 国产九九九精品视频| 日本99精品| 国产真裸无庶纶乱视频| 欧美日韩精品在线一区| 国产日韩欧美三级| 男女午夜爽爽| 国产一区二区伦理| 福利视频亚洲一区| 麻豆精品国产入口| 精品国产区| 狠狠躁夜夜躁2020| 国产欧美一区二区三区在线看 | 欧美一区二区久久| 日韩精品一区二区三区不卡| 欧美一区二区三区免费视频| 久99久精品| 国产一区二区三区国产| 欧美一区二区三区在线免费观看| 在线播放国产一区| 欧美日韩三区| 国产三级在线视频一区二区三区| bbbbb女女女女女bbbbb国产| 二区三区免费视频| 狠狠色狠狠色合久久伊人| 男女午夜影院| 国产精品人人爽人人做av片| 清纯唯美经典一区二区| 国产69精品久久久久999小说| 欧美日韩乱码| 日本看片一区二区三区高清| 日韩一级片免费观看| 欧美日韩精品在线一区二区| 91精品啪在线观看国产线免费| 99久久婷婷国产亚洲终合精品| 狠狠色噜噜狠狠狠狠2021天天| 日韩一级视频在线| 亚日韩精品| 国产在线一二区| 亚洲欧洲国产伦综合| 久久密av| 欧美久久精品一级c片| 51区亚洲精品一区二区三区| 精品久久久久久中文字幕大豆网 | 欧美日韩精品不卡一区二区三区 | 国产欧美一区二区在线| 久久国产欧美一区二区三区免费| 91麻豆精品一区二区三区| 亚洲国产一区二区精华液| 精品少妇的一区二区三区四区| 欧美亚洲国产日韩| 国产一区二区电影在线观看| 99日本精品| 国产女性无套免费看网站 | 久久天天躁狠狠躁亚洲综合公司| 久精品国产| 国产乱老一区视频| 午夜激情在线免费观看| 四虎国产精品永久在线国在线| 国产视频精品一区二区三区| 大伊人av| 亚洲伊人久久影院| 亚洲高清久久久| 欧美一级久久精品| 国产精品国产亚洲精品看不卡15 | 国产精品影音先锋| 欧美激情综合在线| 欧美日韩国产精品一区二区| 九九久久国产精品| 久久久久久亚洲精品| 97久久国产亚洲精品超碰热| 性old老妇做受| 欧美日韩国产影院| 久久一区欧美| 欧美综合在线一区| 亚洲精品国产主播一区| 国产原创一区二区| 91免费国产视频| 国产一区二区伦理| 99久久婷婷国产精品综合| 国产区二区| 久久99国产精品久久99| 色妞www精品视频| 久久国产精品麻豆| 国产精品视频十区| 午夜理伦影院| 午夜无遮挡| 欧美精品一卡二卡| 91精品www| 久久五月精品| 国产伦理久久精品久久久久| xxxxhdvideosex| 91一区在线| 日韩欧美国产第一页| 久久青草欧美一区二区三区| 国产精品日韩精品欧美精品| 国产午夜精品一区二区三区四区| 国产精品精品视频一区二区三区| 国产综合久久精品| 91精品久久天干天天天按摩| 国产精品国产亚洲精品看不卡15| 欧美日韩一级在线观看| 国产精品久久国产精品99| 麻豆国产一区二区| 91看片app| 国产精品一品二区三区四区五区| 日韩欧美高清一区| 国产一级大片| 久久国产欧美一区二区三区免费| 国产毛片精品一区二区| 99国产精品永久免费视频| 欧美日韩国产一区二区三区在线观看| 亚洲国产日韩综合久久精品| 91麻豆精品一区二区三区| 性色av色香蕉一区二区| 玖玖国产精品视频|