[發(fā)明專利]一種空間機器人高斯過程軌跡跟蹤控制方法有效
| 申請?zhí)枺?/td> | 202011197637.6 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112318509B | 公開(公告)日: | 2022-04-29 |
| 發(fā)明(設(shè)計)人: | 符啟恩;孫長銀;陸科林 | 申請(專利權(quán))人: | 東南大學 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 南京眾聯(lián)專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 空間 機器人 過程 軌跡 跟蹤 控制 方法 | ||
1.一種空間機器人高斯過程軌跡跟蹤控制方法,其特征在于,所述方法包括以下步驟:
步驟(1)基于稀疏化的高斯過程模型,對空間機器人系統(tǒng)動力學模型進行辨識;
步驟(2)將所辨識的系統(tǒng)與計算轉(zhuǎn)矩控制方法相結(jié)合,得到高斯過程控制律;
步驟(3)在控制過程中,基于邊緣粒子濾波器方法根據(jù)實時得到的數(shù)據(jù)對系統(tǒng)模型進行在線更新;
所述步驟(1)包括:
(11)建立動力學模型,設(shè)定高斯過程模型輸入輸出
空間機器人的動力學模型為
其中為機器人系統(tǒng)廣義變量,u(t)為控制輸入,f(p)為無法精確建模的未知動力學影響,M(q)為廣義慣量矩陣,為廣義科氏力矩陣,均為無法準確得到的模型參數(shù),令空間機器人動力學系統(tǒng)的估計模型為
選擇作為高斯過程模型輸入變量,選擇
作為待辨識的高斯過程模型輸出,代表模型誤差,
(12)獲取訓練數(shù)據(jù)
在輸入空間內(nèi)隨機選取訓練輸入P=[p1,…,pN],選取任意一種控制律u,測量系統(tǒng)各階廣義變量,得到訓練數(shù)據(jù)輸出
(13)給定高斯過程先驗?zāi)P?/p>
對系統(tǒng)模型誤差函數(shù)的各個維度使用獨立的高斯過程進行建模,考慮系統(tǒng)模型誤差函數(shù)h(p)的其中一個維度hd(p),給定其高斯過程先驗為
其中md(p)為均值函數(shù),kd(p,p')為協(xié)方差函數(shù);
(14)高斯過程稀疏化處理;
采用基于引導點的稀疏化方法,對模型誤差函數(shù)hd(p),令其引導輸入為Zd=[zd,1,...,zd,M],引導點值為
(15)超參數(shù)訓練
通過訓練數(shù)據(jù)的似然對高斯過程模型超參數(shù)進行訓練,得到最優(yōu)超參數(shù)為
式中最大化的似然函數(shù)為
其中Kuu=K(Zd,Zd)和Kuh=K(Zd,P)為協(xié)方差矩陣,其元素根據(jù)協(xié)方差函數(shù)得到,
(16)獲得高斯過程后驗?zāi)P?/p>
根據(jù)訓練數(shù)據(jù)和優(yōu)化后的超參數(shù),對待辨識的輸入點p*得到其高斯過程后驗分布
其均值和方差為
其中md,*=md(p*),k*u=k(p*,Zd)為協(xié)方差向量;
(17)整合各維度均值和協(xié)方差
整合系統(tǒng)誤差函數(shù)各維度均值和協(xié)方差為和進一步地,使用P和Z前D維度,得到模型誤差函數(shù)的后驗比例邊際協(xié)方差Σp(q*),使用P和Z前2D維度,得到模型誤差函數(shù)的后驗比例邊際協(xié)方差
2.根據(jù)權(quán)利要求1所述的空間機器人高斯過程軌跡跟蹤控制方法,其特征在于,所述步驟(2)包括:
(21)設(shè)計高斯過程控制律前饋補償部分;
基于高斯過程后驗均值對模型誤差進行補償,設(shè)計高斯過程控制律前饋補償部分
(22)設(shè)計高斯過程控制律反饋控制部分;
基于高斯過程后驗邊際協(xié)方差對反饋增益進行動態(tài)調(diào)整,設(shè)計高斯過程控制律反饋控制部分
其中Gp(·),Gd(·)為對稱正定矩陣值函數(shù),e=q-qd為系統(tǒng)跟蹤誤差,qd,為給定參考軌跡;
(23)設(shè)計高斯過程軌跡跟蹤控制律
設(shè)計高斯過程軌跡跟蹤控制律為
u(t)=uf(t)+ub(t)。
3.根據(jù)權(quán)利要求1所述的空間機器人高斯過程軌跡跟蹤控制方法,其特征在于,所述步驟(3)包括:
(31)實時數(shù)據(jù)獲取;
考慮模型誤差函數(shù)的一個維度d,設(shè)時刻t時新獲得的訓練數(shù)據(jù)為Dt={Pt,hd,t},其中記0:t時刻的全部訓練數(shù)據(jù)為D0:t;
(32)引導輸入點更新;
通過貝葉斯公式得到引導輸入點更新的解析形式,省略對超參數(shù)θd的依賴,設(shè)t-1時刻ud的分布為根據(jù)貝葉斯公式和稀疏化假設(shè),運用卡爾曼濾波中的更新步驟,得到更新后引導點值ud的分布
其均值和方差為
其中Ad,t=Kd(Pt,Zd)Kd(Zd,Zd)-1;
(33)超參數(shù)更新;
使用邊緣粒子濾波器對引導輸入點和超參數(shù)進行綜合更新,其中超參數(shù)的更新采用粒子濾波器方法,設(shè)超參數(shù)滿足以下的馬爾可夫過程
其中和Vd,t-1為θd,t-1的蒙特卡羅均值和方差,a=(3b-1)/(2b),b∈(0.95,0.99);所有待更新變量的分布為
考慮t-1時刻θd,t-1的K個粒子及其對應(yīng)的引導點先驗分布參數(shù)當訓練數(shù)據(jù)D0:t到來后,首先對每一個粒子從進化模型中生成t時刻新的粒子然后使用新的超參數(shù)和對應(yīng)的引導點先驗根據(jù)(32)中的引導點更新算法得到對應(yīng)粒子的引導點后驗分布最后基于訓練數(shù)據(jù)似然來更新粒子權(quán)重,即并執(zhí)行歸一化和重采樣步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學,未經(jīng)東南大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011197637.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





