[發明專利]小型無人直升機的強化學習自適應控制方法有效
| 申請號: | 201910098125.5 | 申請日: | 2019-01-31 |
| 公開(公告)號: | CN109696830B | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 鮮斌;張浩楠;張旭 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 劉國威 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 小型 無人 直升機 強化 學習 自適應 控制 方法 | ||
1.一種小型無人直升機的強化學習自適應控制方法,其特征是,以強化學習自適應控制算法為基礎,結合評價網執行網體系結構,用于小型無直升人機的姿態系統控制中,包括以下步驟:
步驟1)確定小型無人直升機的坐標系定義;
小型無人直升機坐標系定義主要涉及兩個坐標系,慣性坐標系{I}={OI,xI,yI,zI}和機體坐標系{B}={OB,xB,yB,zB},其中Oi(i=I,B)表示坐標系原點,xi,yi,zi(i=I,B)分別對應坐標系三個主軸方向的單位矢量,各坐標系的定義均遵循右手定則,同時定義直升機姿態角在坐標系{I}下表示為η=[φ,θ,ψ]T,φ,θ,ψ分別對應滾轉角、俯仰角和偏航角,目標軌跡姿態角在坐標系{I}下表示為ηd=[φd,θd,ψd]T,φd,θd,ψd分別對應目標旋轉角、目標俯仰角和目標偏航角;
步驟2)確定小型無人直升機姿態動力學模型;
通過分析小型無人直升機作用原理,用拉格朗日方程來描述其姿態動力學模型為:
其中M(η)代表慣性矩陣,代表科氏力矩陣,G(η)為重力力矩向量,d代表未知擾動向量,S代表角速度變換矩陣,A,B代表旋翼動力學相關矩陣,D代表旋翼揮舞角動力學相關矩陣,δ(t)=[δlat(t) δlon(t) δped(t)]T代表控制輸入,δlat(t)代表橫向周期變距,δlon(t)代表縱向周期變距,δped(t)代表尾槳總距,角速度變換矩陣S表示為:
步驟3)定義姿態角跟蹤誤差并整理動力學誤差模型;
定義系統姿態跟蹤誤差e1及其濾波誤差e2為:
e1=η-ηd
其中λ=[λ1,λ2,λ3]T為正常數陣,引入輔助矩陣Ω=S-TAD,輸入轉矩量τI=Ωδ(t),定義性能指標函數為:
其中,Q,R為正定矩陣,需要保證系統的性能指標函數最優,定義哈密爾頓函數為如下形式:
引入評價網來近似性能指標函數J(e1):
其中,為權重向量,為徑向基函數,設計權重更新律為:
其中,a1為評價網絡的自適應增益,為輔助變量;
對e2求一階時間導數,并將式(1)代入整理,得到濾波誤差的開環動態方程為:
其中,輔助函數定義為:
步驟4)控制律設計;
引入執行網絡來逼近系統輔助函數N(x),表示為:
其中,為權重向量,為徑向基函數,設計權重更新律為:
其中,a2為執行網絡的自適應增益;
根據以上分析,設計設計控制輸入δ(t)為:
其中kr,Γ,kv,β均為正常數陣,sgn(·)為標準符號函數;
以上述控制律進行小型無人直升機的姿態控制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910098125.5/1.html,轉載請聲明來源鉆瓜專利網。





