[發明專利]基于可變誤差的非線性系統自適應最優控制方法有效
| 申請號: | 202010240156.2 | 申請日: | 2015-05-25 |
| 公開(公告)號: | CN111308896B | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 劉德榮;魏慶來;林漢權;李超 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 吳夢圓 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 可變 誤差 非線性 系統 自適應 最優 控制 方法 | ||
1.一種在智能控制領域的基于可變誤差的非線性系統自適應最優控制方法,所述方法通過迭代更新性能指標函數和控制律,并通過迭代性能指標函數近似最優性能指標函數,通過迭代控制律近似最優控制律,得到最優性能指標函數和最優控制律,所述方法包括以下步驟:
步驟1、選擇隨機初始狀態x0;選擇任意半正定函數Ψ(xk)≥0,其中是n維的系統狀態向量,表示系統時間k時刻的狀態量,k表示在時間k時刻,k=0,1,2,...;選擇收斂精度ζ;給定參數序列{qi},其中0<qi<1;給定兩個常數0<ξ<1分別表示可變誤差的衰減率;令迭代參數i=0;
步驟2、令初始性能指標函數并求得參數γ0,使其滿足V0(F(xk,uk))≤γ0U(xk,uk),其中F(xk,uk)是系統狀態方程,V0(xk)為初始性能指標函數,U(xk,uk)是系統的效用函數,Ψ(xk)為半正定函數,是m維的系統控制向量,表示在時間k時刻的系統輸入信號;
步驟3、計算得到初始控制律以及初始迭代性能指標函數其中,ρ0(xk)為迭代控制近似誤差,π0(xk)為迭代性能指標函數近似誤差;
步驟4、定義單步迭代的目標迭代性能指標函數為定義全局迭代目標函數為計算獲得參數σ1使其滿足給定任意0<q0≤1,如果σ1滿足其中γ0可由步驟2得到,則估計參數γ1使其滿足V1(F(xk,uk))≤γ1U(xk,uk),并令i=i+1,繼續執行下一步;否則,令陽π0(xk)=ξπ0(xk),返回步驟3繼續執行;
步驟5、對于任意i=1,2,...,計算得到迭代控制律和迭代性能指標函數其中ρi(xk)為迭代控制近似誤差,πi(xk)迭代性能指標函數近似誤差,其中采用兩個神經網絡,即執行網絡與評判網絡分別逼近迭代控制律與迭代性能指標函數;
步驟6、定義全局迭代目標函數為根據目標迭代性能指標函數計算獲得參數σi使其滿足
給定任意0<qi≤1,如果σi滿足則估計γi+1使其滿足Vi+1(F(xk,uk))≤γi+1U(xk,uk),并繼續執行下一步,其中γi+1表示在第i+1次迭代時的參數γi的值;否則,令和πi(xk)=ξπi(xk),返回步驟5繼續執行;
步驟7、如果ζ是收斂精度,即可獲得最優性能指標函數和最優控制律,從而對所述非線性系統進行良好控制;否則令i=i+1繼續返回步驟5執行。
2.如權利要求1所述的在智能控制領域的非線性系統自適應最優控制方法,其特征在于,所述評判網絡與執行網絡均采用BP神經網絡進行構建。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010240156.2/1.html,轉載請聲明來源鉆瓜專利網。





