[發明專利]一種終端迭代學習對接控制方法有效
| 申請號: | 201810880274.2 | 申請日: | 2018-08-03 |
| 公開(公告)號: | CN109062044B | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 全權;任錦瑞;戴訓華;蔡開元 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04 |
| 代理公司: | 北京慧泉知識產權代理有限公司 11232 | 代理人: | 王順榮;唐愛華 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 終端 學習 對接 控制 方法 | ||
1.一種終端迭代學習對接控制方法,該方法中系統的每次運行時間為t∈[0,T],終端時刻為T,期望的系統終端輸出為yd(T),第k次迭代系統終端輸出為yk(T),終端輸出誤差終端迭代學習控制器利用第k次終端輸出誤差ek(T)得到第k+1次迭代的控制輸入uk+1(t),經過多次迭代,最終使終端輸出誤差ek(T)→0;在對接控制中,設計的對接控制器以本次對接誤差作為輸入,輸出下一次對接的控制量,通過幾次迭代,最終達到成功對接;
采用的對接模型如下:
其中,為系統狀態,為系統輸出,為控制輸入,為系統矩陣,為輸入矩陣,φ(·):是一個非線性函數向量,為輸出矩陣,為常值偏移;
因為飛行器都有四個控制輸入,而對接任務中需要控制四個輸出,即三個位置誤差和一個前向速度誤差,所以對接模型為一個四入四出的系統;對接目標為:對接位置誤差為零,對接速度誤差為零或者保持在一個閾值之內;為了解決欠驅動和過驅動問題,會通過飽和控制或者對位置的軌跡規劃來達到速度控制的目標,對應的放棄某個控制輸入,這樣只需要考慮三入三出系統;下文中,直接考慮三入三出系統,即m=3;
采用終端迭代學習控制來解決對接控制問題,則上面的模型重寫為如下的面向控制的模型
其中,為第k次迭代的系統狀態,第k次迭代的系統輸出,為第k次迭代的控制輸入;t∈[0,T]是系統運行時間,下標是迭代次數,t=0時的初始狀態值xk(0)為x0,k,期望的系統終端輸出為yd(T)已知;為了簡便,變量t和k將被省略;
針對式(2),有如下假設:
假設1:只有終端輸出y(T)可測;
假設2:初始狀態xk(0)在每次迭代中被重置;
假設3:函數φ(yk)在M上滿足局部利普希茨條件,即||φ(yk)-φ(yk-1)||≤lφ||yk-yk-1||,其中,lφ是一個正利普希茨常數,是一個開連通集,表示圍繞原點03×1的一個半徑為δ的鄰域;
對接控制目標為:為對接式(2)構建第k次迭代的控制輸入uk(t),t∈[0,T],使得
||yd(T)-yk(T)||→0當k→∞ (3)
其中,yk(T)為第k次迭代的終端系統輸出;
其特征在于:該控制方法具體包括兩個部分:
(1)準備階段:為將要設計的終端迭代學習控制器產生一個基函數使迭代快速收斂,同時控制對接過程來避免超調和誘導振蕩的危險情況;
(2)實施階段:設計一個終端迭代學習控制器來實現對接控制目標(3);
在對接任務中,追蹤飛行器通過機動靠近目標飛行器或目標平臺實現對接;在準備階段,不需要直接考慮復雜的對接模型,只考慮追蹤飛行器模型和其參考模型即可;通過準備工作,獲得基函數Ub(t);盡管對接階段需要執行兩個迭代過程,它們都在對接操作前離線完成;在實施階段,設計的終端迭代學習控制器以重復的學習的方式工作,并最終實現成功對接,控制方法中準備階段和實施階段的具體內容如下:
步驟一:準備階段—基函數的離線產生
采用迭代優化的方法來獲得基函數,具體包括如下兩個步驟:
(1)參考對接軌跡的生成
參考對接軌跡是指追蹤飛行器完成對接任務的一條合理飛行軌跡,同時避免危險情況,采用終端迭代學習方法獲得參考對接軌跡,具體包括如下兩方面:
1)建立參考模型
采用含有三個單通道,每個通道上是一個二階積分環節的虛擬模型作為追蹤飛行器的參考模型
其中,pv(t)=[xv(t) yv(t) zv(t)]T是參考模型輸出,uv(t)=[uv,x(t) uv,y(t) uv,z(t)]T是參考模型輸入;下一步就是要設計一個用來獲得參考對接軌跡pv,r(t)的參考模型輸入uv(t),設計參考模型輸入,數學表達式如下:
其中,uv,s是uv(t)的任意一個元素,下標s={x,y,z},tstart和tend是對接操作的開始和結束時間,則這里T=tend-tstart;cpeak,s是輸入峰值,tpeak,s是從tstart開始的峰值時間;c1為曲線上升段的斜率,c2為曲線下降段的斜率;加速-減速過程通過在每次迭代中改變參數tpeak,s或者cpeak,s來調整;這里,設置tpeak,s/((tend-tstart)/2)=0.3;下一步就是優化cpeak,s來獲得參考對接軌跡pv,r(t);
2)產生參考對接軌跡
采用無基函數的終端迭代學習控制通過優化cpeak,s來獲得參考對接軌跡pv,r(t);對于建立的輸入為式(5)的參考模型式(4),設計終端迭代學習控制器為
其中,cpeak,x,k+1,cpeak,y,k+1,cpeakz,,k+1分別為第k+1次迭代中輸入uv,x(t),uv,y(t),uv,z(t)的輸入峰值,cpeak,x,k,cpeak,y,k,cpeak,z,k為第k次迭代的輸入峰值,pv(tend)為參考模型的終端輸出,pd(0)為目標飛行器或目標平臺的初始位置,pp(0)為追蹤飛行器的初始位置,a為控制器參數;控制器(6)經過多次離線迭代即獲得參考對接軌跡pv,r(t);
(2)產生參考輸入
根據獲得的參考對接軌跡pv,r(t),采用伴隨型迭代學習控制方法來得到參考輸入,進一步得到基函數;迭代學習控制實現全軌跡完美跟蹤,而伴隨型迭代學習控制可適用于最小相角系統;針對追蹤飛行器
設計伴隨型迭代學習控制器為
其中,pr追蹤飛行器的輸出,xr為追蹤飛行器的狀態,ur=[δT δa δe]為系統輸入,為追蹤飛行器的系統矩陣,為輸入矩陣,為輸出矩陣,δT,k+1,δa,k+1,δe,k+1為第k+1次迭代的系統輸入,δT,k,δa,k,δe,k為第k次迭代的系統輸入,為式(7)對應的算子,是的伴隨算子,αk為控制器參數;經過多次離線迭代,實際輸出可以完美跟蹤參考對接軌跡,此時,δT,r(t),δa,r(t),δe,r(t)為產生參考軌跡pv,r(t)所對應的系統輸入,則基函數為
至此,基函數Ub(t)已經得到,即對接控制的準備工作已經完成;下面進入實施階段;
步驟二:實施階段—終端迭代學習控制器設計
基于產生的基函數Ub(t)設計終端迭代學習控制器;傳統的終端迭代學習控制器將控制輸入或初始狀態值作為學習對象,下面為混合終端迭代學習控制器;
只有部分初始狀態可控,根據狀態可控性,初始狀態重寫為
其中,代表不可控初始狀態,表示可控初始狀態,n1+n2=n,分塊矩陣用來將ξ和ηk分離,而ηk用于迭代過程;
針對對接式(2),設計如下學習控制律
uk(t)=Ub(t)qk (11)
其中,是一個常值參數向量,是準備階段得到的基函數;
將控制輸入和初始狀態值的組合作為學習對象,設計學習更新律為
其中,是常值對角參數矩陣,是第k-1次迭代的對接誤差;
對于對接式(2),當假設1-3都滿足,終端迭代學習控制律和學習更新律分別設計為式(11)和(12)時,如果不等式
α1+γ1<1 (13)
成立,那么||yd(T)-yk(T)||→0當k→∞,不等式(13)是由壓縮映射原理推導出的條件;其中
這里,為單位矩陣,β1(t)為計算的中間變量,τ為積分變量,Ub(τ)即前文中的Ub(t),只是計算中進行了積分變量的替換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810880274.2/1.html,轉載請聲明來源鉆瓜專利網。





