[發明專利]一種基于迭代學習的四旋翼飛行器魯棒跟蹤控制方法在審
| 申請號: | 202010428659.2 | 申請日: | 2020-05-20 |
| 公開(公告)號: | CN111650830A | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 穆朝絮;張勇;孫長銀 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04;G05D1/08 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 學習 四旋翼 飛行器 跟蹤 控制 方法 | ||
1.一種基于迭代學習的四旋翼飛行器魯棒跟蹤控制方法,其特征在于,所述方法包括:
1)針對含有時變不確定性的四旋翼飛行器動態微分方程進行分析,建立位置跟蹤誤差子系統、姿態跟蹤誤差子系統;
2)獲取姿態跟蹤誤差子系統的狀態空間模型,定義位置跟蹤誤差子系統的耦合不確定性,建立位置跟蹤誤差子系統狀態空間模型;
3)考慮時變不確定性特性、耦合不確定性特性,針對位置跟蹤誤差子系統、姿態跟蹤誤差子系統的標稱系統,建立考慮耦合不確定項的代價函數;基于代價函數,求解得到最優控制率;
4)基于自適應動態規劃方法,設計改進的神經網絡權值更新規則,近似求解得到魯棒跟蹤控制器,實現基于迭代學習的近似最優跟蹤控制。
2.根據權利要求1所述的一種基于迭代學習的四旋翼飛行器魯棒跟蹤控制方法,其特征在于,所述定義位置跟蹤誤差子系統的耦合不確定性,建立位置跟蹤誤差子系統狀態空間模型具體為:
其中,U1(E1(t))是待設計的魯棒跟蹤控制策略,f′σ(t)是位置跟蹤誤差子系統的耦合項,d1(t)為位置跟蹤誤差子系統的時變不確定性,f1(E1(t))為位置跟蹤誤差子系統動態,g1(.)為控制增益矩陣;
其中,U1'(t)表示虛擬策略,反映了兩個跟蹤誤差子系統間的耦合不確定性,U1'(t)用于減小耦合不確定性對位置跟蹤誤差子系統的影響,m為四旋翼飛行器的質量,為四旋翼飛行器位置與姿態狀態的耦合矩陣,uα(t)為四旋翼飛行器的升力,G為重力加速度矩陣。
3.根據權利要求2所述的一種基于迭代學習的四旋翼飛行器魯棒跟蹤控制方法,其特征在于,所述代價函數具體為:
其中,η是正實數,Uu(Ei(t),Vi(Ei(t)))為效用函數,‖Dm(Ecou)‖為系統擾動代價項;位置跟蹤誤差子系統和姿態跟蹤誤差子系統中,變量的下標分別對應i=1和i=2。
Uu(Ei(t),Vi(Ei))在均衡點處等于零:
‖Dm(Ecou)‖2=‖f′σ(t)‖
其中,Qi和Mi為正定矩陣。
4.根據權利要求3所述的一種基于迭代學習的四旋翼飛行器魯棒跟蹤控制方法,其特征在于,所述最優控制率為:
其中,為控制增益矩陣的轉置,為最優代價函數關于Ei的偏導數,Ei為跟蹤誤差狀態變量。
5.根據權利要求1所述的一種基于迭代學習的四旋翼飛行器魯棒跟蹤控制方法,其特征在于,所述步驟4)具體為:
建立評價網絡,推導得到哈密爾頓誤差,其中包含耦合不確定性的影響,定義二次型誤差函數;
設計改進的神經網絡權值更新規則,放松對于初始穩定控制策略的要求。
6.根據權利要求1所述的一種基于迭代學習的四旋翼飛行器魯棒跟蹤控制方法,其特征在于,所述改進的神經網絡權值更新規則具體為:
其中,γci,γsi>0,分別是評價網絡主要學習率和輔助學習率,為評價網絡近似過程中引入的誤差,為最優權值矩陣的估計值,為激活函數,Ei(t)為跟蹤誤差狀態變量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010428659.2/1.html,轉載請聲明來源鉆瓜專利網。





