[發(fā)明專利]電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的點(diǎn)對點(diǎn)迭代學(xué)習(xí)優(yōu)化控制方法有效
| 申請?zhí)枺?/td> | 201911119240.2 | 申請日: | 2019-11-15 |
| 公開(公告)號: | CN110815225B | 公開(公告)日: | 2020-12-25 |
| 發(fā)明(設(shè)計(jì))人: | 陶洪峰;李健;黃彥德 | 申請(專利權(quán))人: | 江南大學(xué) |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 無錫華源專利商標(biāo)事務(wù)所(普通合伙) 32228 | 代理人: | 聶啟新 |
| 地址: | 214122 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 電機(jī) 驅(qū)動 機(jī)械 系統(tǒng) 點(diǎn)對點(diǎn) 學(xué)習(xí) 優(yōu)化 控制 方法 | ||
1.電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的點(diǎn)對點(diǎn)迭代學(xué)習(xí)優(yōu)化控制方法,其特征在于,所述方法包括:建立電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的物理模型;構(gòu)建電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的離散狀態(tài)空間模型;建立點(diǎn)對點(diǎn)軌跡跟蹤模型;設(shè)計(jì)點(diǎn)對點(diǎn)迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法;分析所述點(diǎn)對點(diǎn)迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法的收斂性和魯棒性;分析所述點(diǎn)對點(diǎn)迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法在輸入約束條件下的收斂性和魯棒性;實(shí)現(xiàn)所述電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)在有輸入約束情形下的點(diǎn)對點(diǎn)軌跡跟蹤;
第一步、建立所述電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的物理模型:
電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的物理模型如式(1)所示:
其中,Nl=m2gl+m1gl,g為重力加速度,θ為連桿角度,i為電流,Kt為扭矩,Kb為反電動勢系數(shù),Bc為軸承粘滯摩擦系數(shù),Dc為負(fù)載系數(shù),l為連桿長度,m1為負(fù)載質(zhì)量,m2為連桿質(zhì)量,Rr為電阻,u為電機(jī)控制電壓,Ξ為執(zhí)行器轉(zhuǎn)動慣量,Γ為電抗;
第二步、構(gòu)建電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的離散狀態(tài)空間模型:
利用所述電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的連桿角度和電流定義狀態(tài)變量:定義電機(jī)控制電壓u為輸入變量,則式(1)所示的一種電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)可描述為:
顯然式(2)為連續(xù)系統(tǒng)模型,因此需要對式(2)進(jìn)行離散化,選取滿足香農(nóng)采樣定理的采樣周期Ts,并將連桿角度θ作為輸出,進(jìn)一步可以得到所述電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的離散狀態(tài)空間模型:
式中t和k分別代表采樣時間和批次,批次過程在一個運(yùn)行周期T內(nèi)的時間范圍內(nèi)含有N個采樣點(diǎn),即t∈{0,1,2,…,N};uk(t),yk(t)和xk(t)分別是電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)第k批次t時刻的輸入,輸出和狀態(tài)向量;A,B,C為式(2)對應(yīng)的離散系統(tǒng)參數(shù)矩陣,且滿足CB≠0;并且假設(shè)系統(tǒng)運(yùn)行的初始狀態(tài)一致,即xk(0)=x0;
第三步、建立所述點(diǎn)對點(diǎn)軌跡跟蹤模型:
針對式(3)形式的離散狀態(tài)空間模型,可將其狀態(tài)空間表達(dá)式轉(zhuǎn)換為時間序列的輸入輸出矩陣模型:
yk=Guk+d (4)
其中:
d=[CA CA2 CA3…CAN]Tx0
uk=[uk(0),uk(1),...,uk(N-1)]T
yk=[yk(1),yk(2),...,yk(N)]T
G是時間序列上的輸入輸出傳遞矩陣,d是系統(tǒng)初始狀態(tài)對輸出的影響;
在傳統(tǒng)迭代學(xué)習(xí)控制算法設(shè)計(jì)中,參考軌跡通常是固定的,軌跡跟蹤目標(biāo)要求系統(tǒng)輸出在各個時刻隨著批次過程的不斷運(yùn)行逐漸靠近所設(shè)定的期望輸出值,即yk(t)→yd(t),其中yk(t)為第k批次t時刻的系統(tǒng)實(shí)際輸出,yd(t)為第k批次t時刻的系統(tǒng)期望輸出;對于點(diǎn)對點(diǎn)跟蹤問題,只需要跟蹤一些指定的關(guān)鍵時間點(diǎn)的期望值,即yk(ti)=y(tǒng)d(ti),i=1,2,…,M,并且有0≤t1t2…tM≤N;假設(shè)這M個跟蹤點(diǎn)的期望值為:
ydM=[yd(t1),yd(t2),...,yd(tM)]T (5)
同時定義矩陣ψ為M行N列的跟蹤點(diǎn)選擇矩陣,其中ψij為矩陣ψ中第i行第j列的元素,當(dāng)?shù)趇個跟蹤時間點(diǎn)ti被選擇時,該矩陣第i行的所有N個元素除j=ti時為1其余全為0,共選取M個跟蹤時間點(diǎn),從而可得到ψyk為整個軌跡N個采樣時間點(diǎn)所選取的M個跟蹤時間點(diǎn)的實(shí)際輸出值.其具體表達(dá)形式為:
由此可以定義在跟蹤點(diǎn)處的跟蹤誤差為:
ekM=y(tǒng)dM-ψyk (7)
其中,
ekM=[ek(t1),ek(t2),...,ek(tM)]T (8)
第四步、設(shè)計(jì)所述點(diǎn)對點(diǎn)迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法:
在實(shí)際應(yīng)用中,跟蹤誤差e(k+1)M和系統(tǒng)輸入uk+1通常反映了系統(tǒng)各個運(yùn)行批次的收斂性能和能量消耗,較小的跟蹤誤差、控制能量及其控制振蕩對系統(tǒng)的整體性能及其實(shí)際執(zhí)行器的損耗至關(guān)重要,因此需要在迭代學(xué)習(xí)控制優(yōu)化過程中考慮同時對誤差和控制量進(jìn)行優(yōu)化;定義如下性能指標(biāo)函數(shù):
其中Q為對稱正定權(quán)陣,R和S為相應(yīng)的對稱非負(fù)定權(quán)陣,且
將式(4)、式(7)、式(10)代入式(9),通過求解其二次型最優(yōu)解獲得優(yōu)化迭代學(xué)習(xí)控制律為:
uk+1=Luuk+LeekM (11)
其中,
Lu=[(ψG)TQ(ψG)+R+S]-1[(ψG)TQ(ψG)+R],Lu是迭代學(xué)習(xí)控制律控制器輸入項(xiàng)的增益,
Le=[(ψG)TQ(ψG)+R+S]-1(ψG)TQ,Le是誤差項(xiàng)的增益;
第五步、分析所述點(diǎn)對點(diǎn)迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法的收斂性和魯棒性:
若優(yōu)化迭代學(xué)習(xí)控制律(11)滿足條件η=||Lu-Le(ψG)||i21,||·||i2表示矩陣的最大奇異值,則當(dāng)?shù)蝛→∞時,系統(tǒng)在有限期望跟蹤點(diǎn)處的跟蹤輸出誤差收斂;
由式(4),(7)可將式(11)改寫成:
定義系統(tǒng)穩(wěn)態(tài)控制輸入根據(jù)式(12)可得:
u∞-uk+1=(Lu-Le(ψG))(u∞-uk)+ξ (13)
其中ξ=(I-(Lu-Le(ψG)))u∞-Le(ydM-ψd)為零矩陣,對式(13)兩邊取范數(shù)可得||u∞-uk+1||=||(Lu-Le(ψG))(u∞-uk)+ξ||≤η||u∞-uk||,若滿足條件η1,則控制輸入在范數(shù)意義下收斂,進(jìn)一步可得:
其中,I是相應(yīng)維數(shù)的單位矩陣,則可以得到:
當(dāng)各權(quán)重矩陣參數(shù)確定時,從式(15)可以得出,穩(wěn)態(tài)誤差范數(shù)最終將收斂到常值,并且若S越小,在所述優(yōu)化迭代學(xué)習(xí)控制律(11)的作用下系統(tǒng)的點(diǎn)對點(diǎn)跟蹤穩(wěn)態(tài)誤差越小,當(dāng)S取為零矩陣時,系統(tǒng)跟蹤點(diǎn)處的跟蹤輸出誤差范數(shù)可以收斂到零;
在實(shí)際工藝生產(chǎn)過程中,被控系統(tǒng)通常存在一定的建模不確定性;考慮在時間序列上的輸入輸出傳遞矩陣G上加一個在時間域變化的不確定性ΔG,進(jìn)而定義帶有不確定性的時間序列上的輸入輸出傳遞矩陣的表達(dá)式為Gθ=G(I+ΔG),并且定義ΔG=WΔ,不確定因子的有界條件為||Δ||i2≤1,
系統(tǒng)魯棒收斂的條件為:
||Lu-Le(ψGθ)||i21
若對稱非負(fù)定權(quán)陣R取為零矩陣時,由下式:
其中,W是不確定的權(quán)重矩陣;
可得,若參數(shù)滿足條件:
||[(ψG)TQ(ψG)+S]-1(ψG)TQ(ψG)W||i21 (16)
則系統(tǒng)魯棒收斂;若對稱非負(fù)定權(quán)陣R=rI,r≥0,若條件(16)滿足,則依然可保證離散狀態(tài)空間模型(3)在所述優(yōu)化迭代學(xué)習(xí)控制律(11)作用下的魯棒收斂;因?yàn)?ψG)TQ(ψG)+S為對稱正定矩陣,所以可以對其進(jìn)行奇異值分解有(ψG)TQ(ψG)+S=U∑UT,其中U為酉矩陣,以及Σ是元素為σi的滿秩對角陣,記為Σ=diag{σi},為了方便表示,令以及條件滿足可以得到||H||i2=α1,
則可得到:
其中r為任意大于等于0的實(shí)數(shù),則對于R=rI,r≥0,若條件(16)滿足時,系統(tǒng)魯棒收斂,即參數(shù)R=rI的設(shè)計(jì)不影響系統(tǒng)的魯棒性,另一方面,參數(shù)S的設(shè)計(jì)需要滿足條件(16);
第六步、分析所述點(diǎn)對點(diǎn)迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法在輸入約束條件下的收斂性和魯棒性:
在許多工業(yè)過程控制應(yīng)用中,為了確保工業(yè)過程安全、順利地運(yùn)行,需要對輸入變量施加一定的約束,輸入信號約束包括輸入幅值的約束、輸入隨時間方向和批次方向變化的幅度約束,這些約束常以不等式的形式表示;
控制器輸入的飽和約束:
ulow≤uk+1≤uhi (18)
其中ulow,uhi分別為控制器輸入uk+1的下界值與上界值;
兩個相鄰采樣時間之間的輸入變化約束:
δulow≤δuk+1≤δuhi (19)
其中δulow、δuhi分別為輸入變量δuk+1沿時間軸變化的下界值與上界值,δuk+1(t)=uk+1(t-1)-uk+1(t-2);
兩個相鄰批次之間的輸入變化約束:
Δulow≤Δuk+1≤Δuhi (20)
其中Δulow、Δuhi分別為輸入變量Δuk+1沿迭代軸變化的下界值與上界值,Δuk+1=uk+1-uk;
所有上述約束方程都可以轉(zhuǎn)化為Δuk+1的表達(dá)式,首先,所述控制器輸入的飽和約束(18)可以轉(zhuǎn)化為:
ulow-uk≤Δuk+1≤uhi-uk (21)
假設(shè)δu(0)=u0,則δuk+1可以表示為:
δuk+1=μuk+1 (22)
其中:
因此兩個相鄰采樣時間之間的輸入變化約束(19)可以轉(zhuǎn)化為:
δulow-μuk≤μΔuk+1≤δuhi-μuk (24)
上述約束可以組合成下面的線性不等式:
ζuΔuk+1≥ζk+1 (25)
其中:
理論上來說,式(25)所描述的輸入Δuk+1的約束是一個凸集,這里用Ω表示;模型不確定的誤差方程可以表示為:
e(k+1)M=ekM-ψGθΔuk+1 (26)
其中,Gθ是帶有不確定性的時間序列上的輸入輸出傳遞矩陣,與時間序列上的輸入輸出傳遞矩陣G相對應(yīng);
將式(26)代入所述性能指標(biāo)函數(shù)(9)得到:
收斂性與魯棒性分析:
在約束條件下,假設(shè)條件1)存在一個可行的期望輸入u∞和對應(yīng)的期望誤差e∞=0,且滿足ulow≤u∞≤uhi,δulow≤δu∞≤δuhi以及Δulow0,Δuhi0;假設(shè)條件2)Q為對稱正定權(quán)陣,R,S為相應(yīng)的對稱非負(fù)定權(quán)陣;則系統(tǒng)魯棒收斂,并且當(dāng)S取零矩陣時系統(tǒng)穩(wěn)態(tài)誤差收斂到0,即k→∞時,Δuk→0,ekM→0;
定義第k+1批次的最優(yōu)性能指標(biāo)函數(shù)為:
首先考慮Δuk+1=0的情況,此時uk+1=uk,e(k+1)M=ekM,uk+1=uk,所以可以推出(ekM,0,uk)∈Ω,因?yàn)樾阅苤笜?biāo)函數(shù)在點(diǎn)(ekM,0,uk)處的值總是要大于或等于最優(yōu)值,所以可以得到如下關(guān)系式:
以此類推可得:
由式(30)可知,當(dāng)k→∞時Δuk→0,因?yàn)楫?dāng)k足夠大時Δuk→0,且滿足條件Δulow0,Δuhi0,所以約束條件Δulow≤Δuk+1≤Δuhi同樣滿足;根據(jù)假設(shè)條件1)可知當(dāng)uk+1=u∞時e(k+1)M=0,則也是一個約束區(qū)域內(nèi)的可行點(diǎn),其中顯然(e(k+1)M,Δuk+1,uk+1)也是一個約束區(qū)域內(nèi)的可行點(diǎn),因?yàn)棣笧橐煌辜梢酝瞥靓竷?nèi)任意兩個可行點(diǎn)之間的點(diǎn)都是可行點(diǎn);
同時,求解性能指標(biāo)函數(shù)Jk+1從(e(k+1)M,Δuk+1,uk+1)到的方向?qū)?shù):
由式(31)可以得到:
因?yàn)楫?dāng)k→∞時Δuk→0,因此當(dāng)k→∞時式(32)可簡化為:
由式(33)以及假設(shè)條件2)可知,當(dāng)k→∞時系統(tǒng)穩(wěn)態(tài)輸出誤差收斂到某一有界值,當(dāng)S取零矩陣時,穩(wěn)態(tài)輸出誤差到達(dá)最小且為0;上述結(jié)果表明,假設(shè)條件成立時,輸入約束模型不確定系統(tǒng)在所述優(yōu)化迭代學(xué)習(xí)控制律(11)作用下依然可以收斂;當(dāng)系統(tǒng)為標(biāo)稱系統(tǒng),即Gθ=G時,結(jié)論同樣成立;
第七步、根據(jù)魯棒優(yōu)化迭代學(xué)習(xí)控制律確定所述電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)的每一迭代批次的輸入矢量,將得到的所述輸入矢量輸入所述電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)進(jìn)行點(diǎn)對點(diǎn)軌跡跟蹤控制,所述電機(jī)驅(qū)動單機(jī)械臂系統(tǒng)在輸入矢量的控制作用下追蹤指定跟蹤點(diǎn)處的期望輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江南大學(xué),未經(jīng)江南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911119240.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





