[發(fā)明專利]一種面向未知環(huán)境約束的可重構(gòu)機(jī)械臂控制方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110447459.6 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN113103237B | 公開(公告)日: | 2022-10-04 |
| 發(fā)明(設(shè)計)人: | 馬冰;董博;張振國;安天驕;盧曾鵬 | 申請(專利權(quán))人: | 長春工業(yè)大學(xué) |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 北京方圓嘉禾知識產(chǎn)權(quán)代理有限公司 11385 | 代理人: | 馮靜 |
| 地址: | 130012 吉林*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 未知 環(huán)境 約束 可重構(gòu) 機(jī)械 控制 方法 系統(tǒng) | ||
1.一種面向未知環(huán)境約束的可重構(gòu)機(jī)械臂控制方法,其特征在于,包括:
構(gòu)建約束空間下多自由度的可重構(gòu)機(jī)械臂的動力學(xué)模型;
基于所述動力學(xué)模型,采用自適應(yīng)估計參數(shù)法建立所述可重構(gòu)機(jī)械臂的狀態(tài)空間方程;
基于所述狀態(tài)空間方程,采用多信息融合函數(shù)構(gòu)建性能指標(biāo)函數(shù)和哈密爾頓-雅可比-貝爾曼函數(shù);
采用自適應(yīng)動態(tài)規(guī)劃算法,通過神經(jīng)網(wǎng)絡(luò)評價模型對所述性能指標(biāo)函數(shù)進(jìn)行估計,得到性能指標(biāo)估計函數(shù),并基于所述性能指標(biāo)估計函數(shù),采用策略迭代算法對所述哈密爾頓-雅可比-貝爾曼函數(shù)進(jìn)行求解,得到近似的最優(yōu)力和位置跟蹤控制策略;所述近似的最優(yōu)力和位置跟蹤控制策略為所述哈密爾頓-雅可比-貝爾曼函數(shù)最小時對應(yīng)的力和位置跟蹤控制策略;
所述基于所述動力學(xué)模型,采用自適應(yīng)估計參數(shù)法建立所述可重構(gòu)機(jī)械臂的狀態(tài)空間方程,具體包括:
將受未知環(huán)境約束的可重構(gòu)機(jī)械臂的未知約束方程線性參數(shù)化,得到線性表示形式;
由所述線性表示形式確定反映約束環(huán)境空間與任務(wù)工作空間關(guān)系的雅可比矩陣;
對所述反映約束環(huán)境空間與任務(wù)工作空間關(guān)系的雅可比矩陣進(jìn)行估計,得到估計矩陣;
基于所述估計矩陣確定可重構(gòu)機(jī)械臂的末端效應(yīng)器與約束環(huán)境接觸所產(chǎn)生的接觸力矩估計值;
由所述動力學(xué)模型和所述接觸力矩估計值構(gòu)建所述可重構(gòu)機(jī)械臂的狀態(tài)空間方程;
所述基于所述狀態(tài)空間方程,采用多信息融合函數(shù)構(gòu)建性能指標(biāo)函數(shù)和哈密爾頓-雅可比-貝爾曼函數(shù),具體包括:
基于所述狀態(tài)空間方程,構(gòu)建包含末端效應(yīng)器的跟蹤誤差和接觸力偏差的多信息融合函數(shù);所述多信息融合函數(shù)為
其中,m(t)為t時刻的多信息融合函數(shù),eq為關(guān)節(jié)位置跟蹤誤差,為關(guān)節(jié)速度跟蹤誤差,eτ為末端效應(yīng)器約束力矩跟蹤誤差,kdeq為的系數(shù),keq為的系數(shù),kτ為eτ的系數(shù);
由所述多信息融合函數(shù)構(gòu)建性能指標(biāo)函數(shù)和哈密爾頓-雅可比-貝爾曼函數(shù);
所述性能指標(biāo)函數(shù)為
其中,P(m(t))為t時刻的性能指標(biāo)函數(shù),Ψ(Ω)為由一系列可行的控制策略組成的集合,u為控制輸入力矩,N(m(t),u(m(t)))為t時刻的效用函數(shù),u(m(t))為t時刻的多信息融合函數(shù)對應(yīng)的力和位置跟蹤控制策略;
所述哈密爾頓-雅可比-貝爾曼函數(shù)為
其中,為哈密爾頓-雅可比-貝爾曼函數(shù),m為多信息融合函數(shù),u(m)為多信息融合函數(shù)對應(yīng)的力和位置跟蹤控制策略,為性能指標(biāo)函數(shù)P(m)對m的偏微分函數(shù),N(m,u(m))為效用函數(shù),為多信息融合函數(shù)的一階導(dǎo)數(shù),為t時刻的性能指標(biāo)函數(shù)P(m(t))對m(t)的偏微分函數(shù),為估計接觸力矩,vc為與力和位置跟蹤誤差相關(guān)的函數(shù),Qc為多信息融合函數(shù)對應(yīng)的給定的正定矩陣,Rc為力和位置跟蹤控制策略對應(yīng)的給定的正定矩陣,n為可重構(gòu)機(jī)械臂的自由度,為n×n維的空間,表示與可重構(gòu)機(jī)械臂系統(tǒng)慣性項、離心力-哥氏力項和重力項相關(guān)的非線性函數(shù),g(q)表示為與重力項相關(guān)的模型函數(shù),q為關(guān)節(jié)位置向量,為關(guān)節(jié)速度向量;
采用自適應(yīng)動態(tài)規(guī)劃算法,通過神經(jīng)網(wǎng)絡(luò)評價模型對所述性能指標(biāo)函數(shù)進(jìn)行估計,得到性能指標(biāo)估計函數(shù),并基于所述性能指標(biāo)估計函數(shù),采用策略迭代算法對所述哈密爾頓-雅可比-貝爾曼函數(shù)進(jìn)行求解,得到近似的最優(yōu)力和位置跟蹤控制策略,具體包括:
(1)利用策略迭代算法求解哈密爾頓方程得到最優(yōu)性能指標(biāo)函數(shù),然后將解結(jié)合策略迭代算法得到最優(yōu)控制策略,步驟如下:
步驟1:參數(shù)初始化,選擇i為迭代次數(shù),當(dāng)i=0時,給定一個初始的容許控制μ(0)(m),并選取一個正常數(shù)δ;
步驟2:當(dāng)i>0時,結(jié)合控制策略μ(i)(m),通過以下的等式來更新性能指標(biāo)函數(shù)P(i)(m),
這里性能指標(biāo)函數(shù)P(i+1)(m)=0,為P(i+1)(m)對m的偏微分函數(shù);
步驟3:通過以下等式來更新控制策略μ(i)(m),
步驟4:如果||P(i+1)(m)-P(i)(m)||≤δ,停止計算,得到最優(yōu)控制策略;否則,令i=i+1,轉(zhuǎn)到步驟2;
步驟5:停止;
所述近似的最優(yōu)力和位置跟蹤控制策略為
其中,為近似的最優(yōu)力和位置跟蹤控制策略,為力和位置跟蹤控制策略對應(yīng)的給定的正定矩陣,gT(q)為與慣性矩陣相關(guān)的模型函數(shù),為神經(jīng)網(wǎng)絡(luò)評價模型中激活函數(shù)的偏導(dǎo)數(shù),為神經(jīng)網(wǎng)絡(luò)評價模型中權(quán)值的估計值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于長春工業(yè)大學(xué),未經(jīng)長春工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110447459.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測終端和環(huán)境檢測系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計裝置和環(huán)境估計方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測儀(環(huán)境貓)





