日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專(zhuān)利]一種非線性離散時(shí)間系統(tǒng)的在線學(xué)習(xí)控制方法有效

專(zhuān)利信息
申請(qǐng)?zhí)枺?/td> 202011635930.6 申請(qǐng)日: 2020-12-31
公開(kāi)(公告)號(hào): CN113485099B 公開(kāi)(公告)日: 2023-09-22
發(fā)明(設(shè)計(jì))人: 李新興;查文中;王雪源;王蓉 申請(qǐng)(專(zhuān)利權(quán))人: 中國(guó)電子科技集團(tuán)公司信息科學(xué)研究院
主分類(lèi)號(hào): G05B13/02 分類(lèi)號(hào): G05B13/02
代理公司: 北京中知法苑知識(shí)產(chǎn)權(quán)代理有限公司 11226 代理人: 李明;趙吉陽(yáng)
地址: 100086 北京*** 國(guó)省代碼: 北京;11
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 非線性 離散 時(shí)間 系統(tǒng) 在線 學(xué)習(xí) 控制 方法
【說(shuō)明書(shū)】:

發(fā)明公開(kāi)了非線性離散時(shí)間系統(tǒng)的在線學(xué)習(xí)控制方法,包括行為策略選擇步驟,最優(yōu)Q?函數(shù)定義步驟,評(píng)價(jià)網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)引入步驟,估計(jì)誤差計(jì)算步驟,以及最后的最優(yōu)權(quán)重計(jì)算步驟,當(dāng)評(píng)價(jià)網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)的權(quán)重收斂之后,執(zhí)行網(wǎng)絡(luò)的輸出即為最優(yōu)控制器的近似值。本發(fā)明無(wú)需在策略評(píng)估和策略提高之間反復(fù)迭代,可實(shí)現(xiàn)對(duì)最優(yōu)控制器的實(shí)時(shí)在線學(xué)習(xí);采用離軌策略學(xué)習(xí)機(jī)制,有效克服了直接啟發(fā)式動(dòng)態(tài)規(guī)劃方法對(duì)狀態(tài)?策略空間探索不足的問(wèn)題,執(zhí)行網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò)可使用任意形式的激活函數(shù),本發(fā)明可實(shí)現(xiàn)對(duì)最優(yōu)控制器的在線學(xué)習(xí),并且無(wú)需系統(tǒng)模型,僅需要行為策略產(chǎn)生的狀態(tài)數(shù)據(jù)。

技術(shù)領(lǐng)域

本發(fā)明涉及工業(yè)生產(chǎn)控制領(lǐng)域,具體的,涉及一種對(duì)非線性離散時(shí)間系統(tǒng)的在線學(xué)習(xí)控制方法。

背景技術(shù)

在工業(yè)生產(chǎn)的過(guò)程中,工程技術(shù)人員往往需要對(duì)機(jī)器人、無(wú)人機(jī)、無(wú)人車(chē)等控制對(duì)象的控制器進(jìn)行優(yōu)化設(shè)計(jì),以滿足一定的控制指標(biāo)要去。由于上述控制對(duì)象往往表現(xiàn)出很強(qiáng)的非線性,使得控制器的優(yōu)化面臨很大困難。從最優(yōu)控制的角度來(lái)看,獲得最優(yōu)控制控制器需要求解復(fù)雜的哈密頓-雅可比-貝爾曼方程(HJB方程),但HJB方程為非線性的偏微分方程,非常難求解。傳統(tǒng)的動(dòng)態(tài)規(guī)劃、變分法、譜方法等由于具有極高的計(jì)算復(fù)雜度,在實(shí)際應(yīng)用過(guò)程中往往面臨很大的局限性。

自適應(yīng)動(dòng)態(tài)規(guī)劃作為近年來(lái)興起的一種新型的智能控制算法,通過(guò)將強(qiáng)化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)近似、動(dòng)態(tài)規(guī)劃以及自適應(yīng)控制等技術(shù)進(jìn)行融合,可實(shí)現(xiàn)對(duì)最優(yōu)控制器的在線學(xué)習(xí),有效克服了傳統(tǒng)方法計(jì)算復(fù)雜度高的問(wèn)題。針對(duì)非線性離散時(shí)間系統(tǒng)的最優(yōu)控制問(wèn)題,Jennie?Si和Yu-Tsung?Wang在論文“Online?learning?control?by?association?andreinforcement”中首次提出了直接啟發(fā)式動(dòng)態(tài)規(guī)劃算法,該算法采用廣義策略迭代的基本思想,通過(guò)引入兩個(gè)神經(jīng)網(wǎng)絡(luò)(即執(zhí)行網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò)),可實(shí)現(xiàn)對(duì)最優(yōu)控制器和最優(yōu)值函數(shù)的實(shí)時(shí)在線學(xué)習(xí)。經(jīng)過(guò)近些年的不斷發(fā)展,算法的收斂性和穩(wěn)定性分析目前也具有一定的理論基礎(chǔ)。雖然直接啟發(fā)式動(dòng)態(tài)規(guī)劃算法可實(shí)現(xiàn)在線自適應(yīng)最優(yōu)控制,該算法仍存在以下不足:1)該算法采用了在軌策略(on-policy)學(xué)習(xí)機(jī)制,存在對(duì)狀態(tài)-策略空間探索不足的問(wèn)題,容易陷入局部最優(yōu)解;2)執(zhí)行網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò)的激活函數(shù)均采用的雙曲正切函數(shù),并且目前所有的收斂性和穩(wěn)定性分析結(jié)果均以雙曲正切函數(shù)為基礎(chǔ),對(duì)于其他類(lèi)型的激活函數(shù)則不再適用。

因此,如何克服上述的直接啟發(fā)式動(dòng)態(tài)規(guī)劃方法存在的以上不足,使得收斂性和穩(wěn)定性分析結(jié)果不再局限雙曲正切函數(shù),成為現(xiàn)有技術(shù)亟需解決的技術(shù)問(wèn)題。

發(fā)明內(nèi)容

本發(fā)明的目的在于提出一種非線性離散時(shí)間系統(tǒng)的在線學(xué)習(xí)控制方法,能夠?qū)顟B(tài)-策略空間具有更好的探索能力,使得執(zhí)行網(wǎng)絡(luò)和評(píng)價(jià)網(wǎng)絡(luò)的激活函數(shù)類(lèi)型可任意選擇,不再局限于雙曲正切函數(shù);相比于策略迭代或值迭代等迭代式方法,該方法可實(shí)現(xiàn)對(duì)最優(yōu)控制器的在線學(xué)習(xí),并且無(wú)需系統(tǒng)模型,僅需要行為策略產(chǎn)生的狀態(tài)數(shù)據(jù)。

為達(dá)此目的,本發(fā)明采用以下技術(shù)方案:

一種非線性離散時(shí)間系統(tǒng)的在線學(xué)習(xí)控制方法,包括如下步驟:

行為策略選擇步驟S110:

根據(jù)被控對(duì)象的特點(diǎn),利用已有經(jīng)驗(yàn)選擇行為策略u(píng),行為策略為學(xué)習(xí)過(guò)程中實(shí)際應(yīng)用到被控對(duì)象的控制策略,其主要作用是用來(lái)產(chǎn)生學(xué)習(xí)過(guò)程中需要用到的系統(tǒng)狀態(tài)數(shù)據(jù);

最優(yōu)Q-函數(shù)定義步驟S120:

定義如下的最優(yōu)Q-函數(shù):

其物理意義為:在k時(shí)刻,采取行為策略u(píng),而在之后的所有時(shí)刻,均采取最優(yōu)控制策略u(píng)*,即目標(biāo)策略,由最優(yōu)Q-函數(shù)定義可知,上式可等價(jià)表示為:

最優(yōu)控制可表示為:

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)電子科技集團(tuán)公司信息科學(xué)研究院,未經(jīng)中國(guó)電子科技集團(tuán)公司信息科學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011635930.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

×

專(zhuān)利文獻(xiàn)下載

說(shuō)明:

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū);

2、支持發(fā)明專(zhuān)利 、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利(升級(jí)中);

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專(zhuān)利網(wǎng)在線咨詢(xún)

周一至周五 9:00-18:00

咨詢(xún)?cè)诰€客服咨詢(xún)?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美激情片一区二区| 日韩av在线网| 欧美久久久一区二区三区| 亚洲欧美日韩国产综合精品二区 | 国产1区2区3区| 国模少妇一区二区三区| 91黄色免费看| 中文字幕制服狠久久日韩二区| 久久综合二区| 狠狠色综合久久婷婷色天使| 久久激情图片| 国产一级不卡视频| 亚洲少妇一区二区| 亚洲国产精品激情综合图片| 国产精品视频免费一区二区| 久99精品| 国产精品久久久久久久久久久久久久久久| 麻豆天堂网| 国产欧美日韩va另类在线播放| 精品国产区| 国产欧美精品一区二区三区小说| 国产91丝袜在线| 亚洲va欧美va国产综合先锋| 国产精品中文字幕一区二区三区| 99久久婷婷国产精品综合| 欧美日韩激情一区| 欧美精选一区二区三区| 国产欧美日韩精品一区二区图片| 亚洲国产精品综合| 国产欧美一区二区三区在线| 国产欧美日韩精品一区二区三区| 欧美精品第1页| 96国产精品视频| 日韩精品一区二区三区四区在线观看 | 免费看农村bbwbbw高潮| 日本一区午夜艳熟免费| 国内精品99| 午夜一级免费电影| 黄色国产一区二区| 国产91精品高清一区二区三区| 国产精品亚发布| 中文字幕区一区二| 四虎精品寂寞少妇在线观看| 91麻豆精品国产91久久久更新资源速度超快| 日韩精品一区二区久久| 国产欧美一区二区三区不卡高清| 久久人人97超碰婷婷开心情五月| 欧美一区二区性放荡片| 国产一级不卡视频| 少妇久久免费视频| 欧美精品久久一区二区| 欧美国产精品久久| 国产一区二区三区久久久| 欧美大片一区二区三区| 91免费国产视频| 午夜毛片电影| 午夜激情影院| 激情久久一区二区三区| 亚洲精品久久在线| 综合久久国产九一剧情麻豆| 国产www亚洲а∨天堂| 国产男女乱淫视频高清免费| 欧美一区二区三区视频在线观看| 亚洲视频精品一区| 亚洲三区二区一区| 久久免费福利视频 | 欧美乱妇高清无乱码| 日韩一区国产| 欧美老肥婆性猛交视频| 精品国产乱码久久久久久久| 国产一区二区三区小说| 中文字幕欧美日韩一区 | 日韩欧美一区精品| 国产精品尤物麻豆一区二区三区 | 一本色道久久综合亚洲精品图片 | 亚洲精品国产一区二区三区| 又色又爽又大免费区欧美| 久久精品国产亚洲一区二区| 99久久99精品| 一色桃子av大全在线播放| 在线亚洲精品| 日本二区在线播放| 国产欧美一区二区在线观看| 欧美日韩精品在线一区二区| 久久99精品久久久噜噜最新章节 | 色综合久久精品| 日韩av在线网址| 亚洲高清国产精品| 欧美日韩乱码| 夜夜躁日日躁狠狠躁| 国产日韩精品一区二区| 国产欧美一区二区精品久久| 久久久一二区| 欧美精品在线观看视频| 97一区二区国产好的精华液| 亚洲精品久久久久999中文字幕| 手机看片国产一区| 久久er精品视频| 电影91久久久| 久久国产欧美一区二区三区免费| 精品国产一区二区三区四区四 | 国产免费一区二区三区四区| 99久久国产综合精品麻豆| 亚洲欧美国产精品久久| 国产日韩欧美91| 欧美精品一区二区久久| 91日韩一区二区三区| 久久精品国产亚洲一区二区| 99国产精品九九视频免费看| 国产理论片午午午伦夜理片2021| 亚洲1区在线观看| 亚洲乱在线| 国产亚洲精品久久久久秋霞| 欧美日韩一区二区三区四区五区 | 一区二区在线精品| 国产乱xxxxx97国语对白| 久久精品国产综合| 激情久久久| 国产精品久久久久久久久久久新郎| 精品欧美一区二区精品久久小说| 久久激情图片| 久久久精品a| 久久影院国产精品| 91福利视频免费观看| 欧美一区二区三区免费在线观看| 国产一区在线免费| 国产亚洲精品久久久久秋霞| 岛国黄色网址| 国产视频一区二区视频| 国产一级一区二区| 国产精品久久亚洲7777| 亚洲乱玛2021| 99国产精品| 99re久久精品国产| 国产在线一卡| 欧美在线视频二区| 国产精品欧美一区二区三区奶水| www.午夜av| 久久99精品久久久野外直播内容| 中文字幕一区二区三区免费视频| 国产伦精品一区二区三区免费下载 | 亚洲乱码一区二区| 久久99视频免费| 亚洲国产欧美一区| 99国产精品免费| 国产精品欧美久久| 国产99久久久久久免费看| 久久精品亚洲精品国产欧美| 国产资源一区二区| 久久一级精品视频| 国产精品视频久久久久久| 99久久免费精品国产男女性高好| 狠狠色噜噜狠狠狠狠米奇777| 精品无人国产偷自产在线 | 国产女人和拘做受在线视频| 日韩精品999| 国产视频二区在线观看| 亚洲国产美女精品久久久久∴| 97久久超碰国产精品| 国产在线精品一区二区在线播放| 国产69精品99久久久久久宅男| 日本一二三不卡| 四虎国产永久在线精品| 欧美人妖一区二区三区| 国产精品一区在线播放| 99精品视频一区| 夜色av网| 狠狠色狠狠色很很综合很久久| 亚洲欧美日韩精品在线观看| 四虎久久精品国产亚洲av| 国产精品欧美日韩在线| 秋霞av电影网| 精品一区中文字幕| 欧美日韩一区在线视频| 四虎国产永久在线精品| 日韩精品一区二区免费| 国产女人和拘做受视频免费| 韩日av一区二区| 久久一二区| 久久免费福利视频| 午夜少妇性影院免费观看| 一区二区三区日韩精品| 夜夜躁人人爽天天天天大学生 | 国产精品国产三级国产专区55| 狠狠色丁香久久综合频道日韩| 国产jizz18女人高潮| 午夜精品在线观看| 国产日韩欧美一区二区在线播放| 天摸夜夜添久久精品亚洲人成| 国产精品伦一区二区三区在线观看| 国产精品二区在线| 精品国产一级| aaaaa国产欧美一区二区| 91麻豆精品国产91久久久资源速度| 91精品啪在线观看国产| 国产69精品久久久久男男系列| 欧美一区二区三区久久久久久桃花 | 欧美亚洲视频一区二区| 亚洲精品性| 夜夜躁日日躁狠狠躁| 中文字幕一区二区三区免费视频| 狠狠躁天天躁又黄又爽| 国产69精品99久久久久久宅男| freexxxx性| 伊人av中文av狼人av| 亚洲国产精品日韩av不卡在线| 精品国产1区2区| 草逼视频网站| 精品久久久久久久久亚洲| 久久99精品久久久噜噜最新章节| 国产一区二区三区伦理| 鲁一鲁一鲁一鲁一鲁一av| 欧美精品亚洲一区| 欧美精品九九| 精品国产免费久久| 性生交大片免费看潘金莲| 中文丰满岳乱妇在线观看| 亚洲制服丝袜中文字幕| 麻豆天堂网| 精品国产一区二| 国产一区=区| 欧美乱战大交xxxxx| 视频一区二区三区中文字幕| 国产乱人伦偷精品视频免下载| 欧美一区二区精品久久| 国产亚洲精品久久777777| 国产99久久久国产精品免费看| 久久99国产综合精品| 国产精品欧美久久| 日韩av在线播| 欧洲精品一区二区三区久久| 午夜一区二区三区在线观看| 国产aⅴ一区二区| 国产无遮挡又黄又爽又色视频 | 亚洲国产视频一区二区三区| 国产精品1区二区| 综合久久激情| 久久国产欧美一区二区免费| 精品国产乱码久久久久久久久| 夜夜躁人人爽天天天天大学生| 国产精品久久久久久久久久久新郎 | 国产精品视频一区二区在线观看| 热久久国产| 欧美一区二区三区中文字幕| 91久久香蕉国产日韩欧美9色| 素人av在线|