[發(fā)明專利]一種移動(dòng)機(jī)器人變批次長(zhǎng)度迭代學(xué)習(xí)優(yōu)化控制方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011171545.0 | 申請(qǐng)日: | 2020-10-28 |
| 公開(公告)號(hào): | CN112318505B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計(jì))人: | 陶洪峰;莊志和;黃彥德;官上雷;胡計(jì)昶;陶新悅 | 申請(qǐng)(專利權(quán))人: | 江南大學(xué) |
| 主分類號(hào): | B25J9/16 | 分類號(hào): | B25J9/16 |
| 代理公司: | 無(wú)錫華源專利商標(biāo)事務(wù)所(普通合伙) 32228 | 代理人: | 聶啟新 |
| 地址: | 214122 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 移動(dòng) 機(jī)器人 批次 長(zhǎng)度 學(xué)習(xí) 優(yōu)化 控制 方法 | ||
1.一種移動(dòng)機(jī)器人變批次長(zhǎng)度迭代學(xué)習(xí)優(yōu)化控制方法,其特征在于,所述方法包括:建立雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)的動(dòng)態(tài)模型;構(gòu)建所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)的離散狀態(tài)空間方程;利用隨機(jī)變量建立批次長(zhǎng)度隨機(jī)變化模型;設(shè)計(jì)批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法;分析所述批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法的收斂性;在輸入約束下設(shè)計(jì)批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法;分析所述輸入約束下的批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法的收斂性;實(shí)現(xiàn)批次長(zhǎng)度可變的所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)在有輸入約束情形下的軌跡跟蹤;
第一步、建立雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)的動(dòng)態(tài)模型:
雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人通過(guò)兩個(gè)后輪的不同速度來(lái)控制移動(dòng)機(jī)器人的速度和航向,在固定平面內(nèi)設(shè)置絕對(duì)坐標(biāo)XOY,假設(shè)所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人在所述固定平面內(nèi)移動(dòng),所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人的實(shí)際物理模型如下:
其中,v表示所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人的線速度,θ表示所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人的位姿角,ur和ul分別表示右輪和左輪的驅(qū)動(dòng)控制輸入,c表示黏性摩擦系數(shù),k表示驅(qū)動(dòng)增益,M1表示所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人的質(zhì)量,Iw表示車輪的轉(zhuǎn)動(dòng)慣量,Iv表示繞機(jī)器人重心的轉(zhuǎn)動(dòng)慣量,r表示車輪半徑,l表示左右輪到機(jī)器人重心的距離;
第二步、構(gòu)建所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)的離散狀態(tài)空間方程:
將所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人的線速度、位姿角和位姿角導(dǎo)數(shù)定義為狀態(tài)變量:定義輸入變量為驅(qū)動(dòng)控制輸入:u=[ur ul]T,輸出變量為所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人的線速度和位姿角:y=[v θ]T,則式(1)所示的所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)描述為:
其中,
對(duì)連續(xù)系統(tǒng)模型式(2)進(jìn)行離散化,選取滿足香農(nóng)采樣定理的采樣周期Ts,進(jìn)一步得到所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)的離散狀態(tài)空間模型:
式中t和k分別代表采樣時(shí)間和批次,批次過(guò)程的運(yùn)行周期為T,且在每個(gè)重復(fù)過(guò)程周期t∈[0,T]內(nèi),取Nd個(gè)采樣點(diǎn);uk(t)∈Rh,yk(t)∈Rm和xk(t)∈Rn分別是所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)第k批次t時(shí)刻的h維輸入、m維輸出和n個(gè)狀態(tài)向量;A,B,C為式(2)對(duì)應(yīng)的離散系統(tǒng)參數(shù)矩陣,且滿足CB≠0;并且假設(shè)系統(tǒng)運(yùn)行的初始狀態(tài)在圍繞期望初始狀態(tài)xd(0)的小范圍內(nèi)隨機(jī)變化,其數(shù)學(xué)期望滿足E{xk(0)}=xd(0);
第三步、利用隨機(jī)變量建立批次長(zhǎng)度隨機(jī)變化模型:
針對(duì)式(3)形式的線性離散系統(tǒng),將其狀態(tài)空間表達(dá)式轉(zhuǎn)換為時(shí)間序列的輸入輸出矩陣模型:
yk=Guk+dk (4)
其中:
uk=[uk(0),uk(1),...,uk(Nd-1)]T
yk=[yk(1),yk(2),...,yk(Nd)]T
G是時(shí)間序列上的輸入輸出傳遞矩陣,dk是系統(tǒng)初始狀態(tài)對(duì)輸出的影響;輸入Hilbert空間和輸出Hilbert空間分別由如下內(nèi)積及相關(guān)的誘導(dǎo)范數(shù)定義:
其中,分別為輸入輸出Hilbert空間上的向量,權(quán)矩陣R和Q為適當(dāng)維數(shù)的實(shí)正定矩陣;
并且,定義期望輸出yd∈l2[0,Nd]為:
yd=[yd(1) yd(2) … yd(Nd)]T (7)
傳統(tǒng)的迭代學(xué)習(xí)控制要求批次長(zhǎng)度固定為預(yù)期長(zhǎng)度Nd,然而實(shí)際的運(yùn)行批次長(zhǎng)度在不同批次之間可能隨機(jī)變化;記第k次迭代實(shí)際批次長(zhǎng)度為Nk,定義實(shí)際批次長(zhǎng)度的最小值與最大值分別為Nm和Nh;實(shí)際情況下一般將預(yù)期長(zhǎng)度Nd設(shè)定為最大長(zhǎng)度,即Nd=Nh;那么實(shí)際批次長(zhǎng)度Nk在{Nm,Nm+1,…,Nd}內(nèi)隨機(jī)變動(dòng),即至多存在τm=Nd-Nm+1個(gè)運(yùn)行批次長(zhǎng)度;為了描述批次長(zhǎng)度的隨機(jī)性,令批次長(zhǎng)度為Nm,Nm+1,…,Nd的概率分別為其中pi0,1≤i≤τm,且
當(dāng)實(shí)際批次長(zhǎng)度Nk小于預(yù)期長(zhǎng)度Nd時(shí),第k批次的輸出yk在時(shí)刻t∈[Nk+1,Nd]是缺失的,不能被用于輸入的更新;將缺失時(shí)刻的跟蹤誤差簡(jiǎn)單地設(shè)置為零,從而轉(zhuǎn)化成常規(guī)情況;那么得到修正后的跟蹤誤差為:
修正后的跟蹤誤差序列為:
當(dāng)NkNd時(shí),ek≠yd-yk,于是引入如下隨機(jī)矩陣Mk來(lái)消除該不等關(guān)系:
其中表示Nk×Nk維的單位矩陣、Im表示m×m維的單位矩陣、表示(Nd-Nk)×(Nd-Nk)維的零矩陣,表示克羅內(nèi)克積,于是修正后的跟蹤誤差序列表示為:
對(duì)于多輸出系統(tǒng),當(dāng)其中一個(gè)輸出出現(xiàn)提前終止的情況,其它的輸出也應(yīng)同時(shí)終止,即使其它輸出并未終止,其產(chǎn)生的輸出也失去了學(xué)習(xí)的價(jià)值;所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人在預(yù)設(shè)軌跡上移動(dòng)時(shí),遇到障礙提前停止,所述線速度變?yōu)榱?,但所述位姿角仍在變化,然而位姿角之后的輸出值失去了迭代學(xué)習(xí)的價(jià)值,因此在刻畫多輸出系統(tǒng)隨機(jī)矩陣的數(shù)學(xué)期望時(shí),看作各輸出具有相同的數(shù)學(xué)期望;
為了計(jì)算所述隨機(jī)矩陣Mk的數(shù)學(xué)期望,引入伯努利二元隨機(jī)變量γk(t)來(lái)表示第k批次時(shí)刻t輸出是否存在;記第k批次時(shí)刻t輸出存在的概率為p(t),則有:
由于E{γk(t)}=P{γk(t)=1}×1+P{γk(t)=0}×0=p(t),則所述隨機(jī)矩陣Mk的數(shù)學(xué)期望計(jì)算如下:
其中,用來(lái)簡(jiǎn)單表示隨機(jī)矩陣的期望;
第四步、設(shè)計(jì)批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法:
將批次長(zhǎng)度隨機(jī)變化的離散狀態(tài)空間模型(3)作為批次長(zhǎng)度隨機(jī)變化系統(tǒng),給定任意初始輸入及對(duì)應(yīng)的跟蹤誤差,通過(guò)如下定義的輸入信號(hào):
得到的輸入序列{uk}k≥0能夠迭代地解決批次長(zhǎng)度隨機(jī)變化下的跟蹤問(wèn)題,其中,M為某一批次的隨機(jī)矩陣,其定義與式(10)相同,輸入信號(hào)的迭代學(xué)習(xí)控制律的前饋形式通過(guò)求解如下定義的第一性能指標(biāo)函數(shù)得到:
將式(11)和式(4)先后代入所述第一性能指標(biāo)函數(shù)(15),求其二次型最優(yōu)解,得:
其中根據(jù)系統(tǒng)初始狀態(tài)的假設(shè)E{xk(0)}=xd(0)可知:
E{dk-dk+1}=0 (17)
將式(17)代入式(16)得:
由于對(duì)于第k+1批次的輸入,第k批次的輸入信號(hào)和跟蹤誤差已知,其期望等于其本身,又由于可逆,將式(18)整理后得到所述迭代學(xué)習(xí)控制律的前饋形式為:
uk+1=uk+Lek (19)
其中是誤差項(xiàng)的學(xué)習(xí)增益;
第五步、分析所述批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法的收斂性:
鑒于所述批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法的特殊性,引入逐次投影思想對(duì)算法進(jìn)行收斂性分析;批次長(zhǎng)度隨機(jī)變化下軌跡跟蹤問(wèn)題的設(shè)計(jì)目標(biāo)是迭代地找到一個(gè)最優(yōu)控制輸入使得跟蹤誤差的期望收斂到零,這等價(jià)于迭代地在Hilbert空間中兩個(gè)集合S1和集合S2的交集中尋找點(diǎn)集合S1和集合S2定義如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (20)
S2={(e,u)∈H:e=0} (21)
其中,所述集合S1表示系統(tǒng)動(dòng)態(tài),所述集合S2表示跟蹤需求;假設(shè)所述集合S1和集合S2在Hilbert空間中存在交集,即Hilbert空間H定義如下:
Hilbert空間H包括跟蹤誤差及輸入信號(hào),其內(nèi)積和相關(guān)的誘導(dǎo)范數(shù)由式(5)和式(6)導(dǎo)出:
其中,分別為輸入輸出Hilbert空間上的向量;
定義投影算子如下:
其中,xo為Hilbert空間H上的一個(gè)點(diǎn),PS(xo)表示xo在集合S上的投影;
對(duì)于xo=(0,u)∈S2,其在S1上的投影為:
優(yōu)化問(wèn)題(26)的解為其中那么:
對(duì)投影算子采取相似的運(yùn)算,對(duì)于有:
優(yōu)化問(wèn)題(28)的解取于是:
根據(jù)逐次投影思想,使用及xk=(0,uk)分別表示對(duì)集合S1和集合S2第k次投影后的點(diǎn),給定一個(gè)初始點(diǎn)x0=(0,u0)∈S2,通過(guò)式(19)進(jìn)行連續(xù)投影能夠得到沿迭代軸更新的輸入序列{uk}k≥0;
設(shè)所述集合S1和集合S2交于一點(diǎn)即由于所述集合S1和集合S2均為Hilbert空間中的有限維閉凸集,根據(jù)逐次投影引理知,序列和{xk}k≥0均收斂于即:
由式(30)得:
第k+1次輸入如式(14)所示,
根據(jù)所述第一性能指標(biāo)函數(shù)式(15),對(duì)于其非最優(yōu)解uk有:
由式(32)得:
E{||ek+1||}≤E{||ek||} (33)
即期望意義下的誤差范數(shù)E{||ek||}單調(diào)收斂至零;
另外,為了得到所述權(quán)矩陣Q和R的選取范圍,將式(19)代入式(33),并全部替換為與ek相關(guān)的形式,得:
其中,為單位矩陣,由于每個(gè)批次的誤差ek均不相同,為了選取一組對(duì)任意批次誤差均滿足式(34)的所述權(quán)矩陣Q和R,需要得到一個(gè)約束條件;對(duì)式(34)兩邊取范數(shù)后,得其一個(gè)必要條件:
將式(35)整理得到所述權(quán)矩陣Q和R應(yīng)滿足的約束條件為:
第六步、在輸入約束下設(shè)計(jì)批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法:
在許多工業(yè)過(guò)程控制應(yīng)用中,為了確保工業(yè)過(guò)程安全、順利地運(yùn)行,需要對(duì)輸入變量施加一定的約束,輸入約束集Ω通常為凸集;所述輸入約束集Ω一般有如下幾種形式:
控制器輸入的飽和約束:
Ω={u∈l2[0,Nd]:|u(t)|≤Z(t),0≤t≤Nd} (37)
其中Z(t)≥0,0≤t≤Nd是隨時(shí)間變化的輸入幅值約束;
控制器輸入的能量約束:
其中Z0是輸入總能量約束;
控制器輸入的震蕩約束:
Ω={u∈l2[0,Nd]:|Δu(t)|≤Z(t),1≤t≤Nd} (39)
其中Δu(t)=u(t)-u(t-1),Z(t)≥0,0≤t≤Nd是隨時(shí)間變化的執(zhí)行器輸入震蕩約束;
當(dāng)出于實(shí)際需要對(duì)輸入信號(hào)進(jìn)行約束時(shí),直接求取輸入約束下的二次規(guī)劃QP問(wèn)題是困難的,于是根據(jù)逐次投影的思想設(shè)計(jì)在實(shí)際應(yīng)用中更易實(shí)現(xiàn)的算法;
對(duì)于所述批次長(zhǎng)度隨機(jī)變化系統(tǒng),給定任意滿足約束的初始輸入及對(duì)應(yīng)的跟蹤誤差,先通過(guò)無(wú)約束的迭代學(xué)習(xí)控制律的前饋形式得到輸入信號(hào)
再將其投影到所述輸入約束集Ω:
從而得到滿足輸入約束的輸入序列{uk∈Ω}k≥0能夠迭代地解決批次長(zhǎng)度隨機(jī)變化下的跟蹤問(wèn)題;由于在實(shí)踐中輸入約束通常是逐點(diǎn)約束,因而需計(jì)算出優(yōu)化問(wèn)題(41)的解;當(dāng)所述輸入約束為飽和約束形式(37)時(shí),對(duì)于t∈[0,Nd],優(yōu)化問(wèn)題(41)的解直接由如下形式給出:
第七步、分析所述輸入約束下的批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法的收斂性:
仍然采用所述逐次投影思想對(duì)所述輸入約束下的批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法進(jìn)行收斂性分析;重新定義集合S1和集合S2如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (43)
S2={(e,u)∈H:e=0,u∈Ω} (44)
與第五步證明類似,對(duì)于x=(0,u)∈S2,其在S1上的投影為:
其中是根據(jù)所述無(wú)約束的迭代學(xué)習(xí)控制律的前饋形式得到的;
對(duì)于其在S2上的投影有:
S2中的和是相互獨(dú)立的,也就是說(shuō)可以分開進(jìn)行求解,于是:
其中
根據(jù)所述逐次投影思想,使用及xk=(0,uk)分別表示對(duì)集合S1和集合S2第k次投影后的點(diǎn),給定一個(gè)初始點(diǎn)x0=(0,u0)∈S2,通過(guò)式(40)和式(41)進(jìn)行連續(xù)投影能夠得到沿迭代軸更新的輸入序列{uk}k≥0;
當(dāng)存在所述輸入約束時(shí),集合S1和集合S2可能不存在交集,所以對(duì)所述輸入約束下的批次長(zhǎng)度可變的迭代學(xué)習(xí)軌跡跟蹤優(yōu)化算法進(jìn)行收斂性分析時(shí),需要考慮和兩種情況;
針對(duì)輸入約束情況,先定義第二性能指標(biāo)函數(shù):
當(dāng)時(shí),仍然得到式(30)和式(31);
xk與集合S1的最小距離為:
根據(jù)所述迭代學(xué)習(xí)控制律的前饋形式,得式(49)的優(yōu)化解為:
u*=uk+Lek (50)
將式(50)代入到式(49)中,得:
同理有:
根據(jù)逐次投影引理的內(nèi)容,每次投影后的抽象距離均單調(diào)減小,得到:
即所述第二性能指標(biāo)函數(shù)是單調(diào)收斂的;
當(dāng)時(shí),首先定義r1=(e,u)∈S1,是兩集合S1和集合S2取最小距離時(shí)線段的兩個(gè)端點(diǎn),同時(shí)這也是如下優(yōu)化問(wèn)題的解:
式(54)等價(jià)于:
那么輸入約束下的最優(yōu)解為:
根據(jù)所述迭代學(xué)習(xí)控制律的前饋形式可知,式(56)內(nèi)部的最小化問(wèn)題的最優(yōu)解為:
將式(57)代入到式(56)中,得:
式(58)中ek前的權(quán)重I-MkGL和L均是可逆的,那么需要最小化的性能指標(biāo)是嚴(yán)格凸的,且所述輸入約束集Ω也是凸的,因此該最小化問(wèn)題具有唯一解,由此可得:
其中,a是一個(gè)正常數(shù),dd由期望初始狀態(tài)導(dǎo)出:
由式(59)得知,誤差范數(shù)的期望有界收斂;
根據(jù)情況下所述第二性能指標(biāo)函數(shù)單調(diào)收斂的證明,同理可證明情況下所述第二性能指標(biāo)函數(shù)單調(diào)收斂;
第八步、實(shí)現(xiàn)批次長(zhǎng)度可變的雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)在有輸入約束情形下的軌跡跟蹤:
根據(jù)所述迭代學(xué)習(xí)控制律確定所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)每一迭代批次的輸入矢量,將得到的輸入矢量輸入批次長(zhǎng)度變化的雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)進(jìn)行軌跡跟蹤控制,所述雙后輪獨(dú)立驅(qū)動(dòng)剛性移動(dòng)機(jī)器人控制系統(tǒng)在批次長(zhǎng)度變化情況下受到輸入矢量的控制作用追蹤期望輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江南大學(xué),未經(jīng)江南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011171545.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 移動(dòng)臺(tái),基站,移動(dòng)通信系統(tǒng),移動(dòng)通信與移動(dòng)通信程序
- 移動(dòng)通信系統(tǒng)、移動(dòng)終端以及移動(dòng)通信方法
- 移動(dòng)支付裝置、移動(dòng)終端POS以及移動(dòng)終端
- 移動(dòng)控制裝置、移動(dòng)體、移動(dòng)體系統(tǒng)、移動(dòng)控制方法及程序
- 移動(dòng)終端后蓋、移動(dòng)終端殼體及移動(dòng)終端
- 移動(dòng)平臺(tái)的輔助移動(dòng)方法、移動(dòng)裝置及移動(dòng)平臺(tái)
- 自移動(dòng)設(shè)備移動(dòng)方法及自移動(dòng)設(shè)備
- 移動(dòng)輪(支撐移動(dòng))
- 移動(dòng)房屋(移動(dòng)酒店)
- 移動(dòng)控制方法、移動(dòng)裝置及移動(dòng)平臺(tái)
- 路徑長(zhǎng)度算出裝置及路徑長(zhǎng)度算出方法
- 損傷長(zhǎng)度測(cè)定系統(tǒng)及損傷長(zhǎng)度測(cè)定方法
- 長(zhǎng)度計(jì)算系統(tǒng)及長(zhǎng)度計(jì)算方法
- 長(zhǎng)度計(jì)算系統(tǒng)及長(zhǎng)度計(jì)算方法
- 長(zhǎng)度量測(cè)方法與長(zhǎng)度量測(cè)裝置
- 可調(diào)節(jié)測(cè)量長(zhǎng)度的長(zhǎng)度傳感器
- 長(zhǎng)度測(cè)量裝置及長(zhǎng)度測(cè)量系統(tǒng)
- 長(zhǎng)度測(cè)量設(shè)備及長(zhǎng)度測(cè)量方法
- 中等長(zhǎng)度導(dǎo)管長(zhǎng)度電子測(cè)量尺
- 中等長(zhǎng)度導(dǎo)管長(zhǎng)度機(jī)械測(cè)量尺





