[發(fā)明專利]一種重組式經(jīng)驗變換型迭代學(xué)習(xí)控制方法有效
| 申請?zhí)枺?/td> | 202110020976.5 | 申請日: | 2021-01-07 |
| 公開(公告)號: | CN112859598B | 公開(公告)日: | 2022-08-19 |
| 發(fā)明(設(shè)計)人: | 許長壽;劉作軍;劉磊;張杰;楊鵬 | 申請(專利權(quán))人: | 河北工業(yè)大學(xué) |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04 |
| 代理公司: | 天津翰林知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 12210 | 代理人: | 王瑞 |
| 地址: | 300130 天津市紅橋區(qū)*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 重組 經(jīng)驗 換型 學(xué)習(xí) 控制 方法 | ||
1.一種重組式經(jīng)驗變換型迭代學(xué)習(xí)控制方法,其特征在于,該方法包括以下步驟:
步驟1、給定一個重復(fù)工作的舊被控系統(tǒng)a,已知其歷次迭代學(xué)習(xí)控制經(jīng)驗數(shù)據(jù),包括舊被控系統(tǒng)第i次迭代學(xué)習(xí)的控制經(jīng)驗序列ua,i;
步驟2、以新被控系統(tǒng)b和舊被控系統(tǒng)a為對象,分別得到新被控系統(tǒng)和舊被控系統(tǒng)的單位階躍響應(yīng)曲線;所述新被控系統(tǒng)為舊被控系統(tǒng)因元件更換或參數(shù)變化后得到的被控系統(tǒng),因此,新被控系統(tǒng)與舊被控系統(tǒng)的期望軌跡相同,均用yd表示;
步驟3、根據(jù)新被控系統(tǒng)和舊被控系統(tǒng)單位階躍響應(yīng)曲線的慣性時間常數(shù)和阻尼特性,將新被控系統(tǒng)和舊被控系統(tǒng)分別進行建模,并進行單位脈沖沖激響應(yīng)的仿真分析,分別得到舊被控系統(tǒng)單位脈沖沖激響應(yīng)曲線和新被控系統(tǒng)單位脈沖沖激響應(yīng)曲線;再分別對舊被控系統(tǒng)單位脈沖沖激響應(yīng)曲線和新被控系統(tǒng)單位脈沖沖激響應(yīng)曲線進行離散化,得到舊被控系統(tǒng)單位脈沖沖激響應(yīng)的經(jīng)驗序列ya和新被控系統(tǒng)單位脈沖沖激響應(yīng)的經(jīng)驗序列yb;
步驟4、將步驟1的舊被控系統(tǒng)第i次迭代學(xué)習(xí)的控制經(jīng)驗序列ua,i通過變換重組得到新被控系統(tǒng)初次迭代學(xué)習(xí)的控制經(jīng)驗序列ub,0;
根據(jù)線性系統(tǒng)的能量守恒與疊加原理,存在如下關(guān)系:
式(3)中,ya(0)表示舊被控系統(tǒng)初始時刻的單位脈沖沖激響應(yīng)的經(jīng)驗值;yb(0)表示新被控系統(tǒng)初始時刻的單位脈沖沖激響應(yīng)的經(jīng)驗值;ua,i(0)表示舊被控系統(tǒng)第i次迭代學(xué)習(xí)初始時刻的控制經(jīng)驗值;ub,0(0)表示新被控系統(tǒng)初次迭代學(xué)習(xí)初始時刻的控制經(jīng)驗值;yd(0)表示新被控系統(tǒng)和舊被控系統(tǒng)初始時刻的期望輸出值;
通過式(3)計算得到ub,0(0);將ub,0(0)帶入變換重組公式的第二行關(guān)系式中,計算得到ub,0(1);以此類推,通過變換重組公式最終得到新被控系統(tǒng)初次迭代學(xué)習(xí)每個時刻的控制經(jīng)驗值ub,0(j),j=0,1,2...k;再將ub,0(j),j=0,1,2...k組合得到新被控系統(tǒng)初次迭代學(xué)習(xí)的控制經(jīng)驗序列ub,0;
變換重組公式如式(4)所示:
式(4)中,yd(1)表示新被控系統(tǒng)和舊被控系統(tǒng)在1時刻的期望輸出值;yd(2)表示新被控系統(tǒng)和舊被控系統(tǒng)在2時刻的期望輸出值;
步驟5、將步驟4得到的新被控系統(tǒng)初次迭代學(xué)習(xí)的控制經(jīng)驗序列ub,0作為新被控系統(tǒng)的輸入初值,根據(jù)式(6)進行新被控系統(tǒng)的迭代學(xué)習(xí)控制:
ub,1(k)=ub,0(k)+L*eb,0(k) (6)
式(6)中,ub,1(k)表示新被控系統(tǒng)第1次迭代學(xué)習(xí)某一時刻k的控制經(jīng)驗值;L表示學(xué)習(xí)增益,為已知量;eb,0(k)=y(tǒng)d(k)-yb,0(k),表示新被控系統(tǒng)某一時刻k的期望輸出值yd(k)與初次迭代學(xué)習(xí)的實際輸出值yb,0(k)之間的誤差。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河北工業(yè)大學(xué),未經(jīng)河北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110020976.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





