[發明專利]一種基于隱半馬爾可夫模型的機械臂控制方法及系統有效
| 申請號: | 202010563175.9 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111872934B | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 徐國政;楊賽;陳盛;高翔;王強;朱博;譚彩銘 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210012 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隱半馬爾可夫 模型 機械 控制 方法 系統 | ||
1.一種基于隱半馬爾可夫模型的機械臂控制方法,其特征在于,包括步驟:
(1)獲取機械臂抓取的觀測數據,利用隱半馬爾可夫模型HSMM對觀測數據建立訓練模型;
(2)利用貝葉斯信息準則BIC對所述訓練模型進行優化,得到最優模型;
(3)使用維特比算法對最優模型進行解碼,得到隱藏的基元運動行為,建立基元運動庫;
(4)計算HSMM新型前向概率,根據HSMM新型前向概率的濾波概率求得當前時刻被激活的運動基元,重新規劃基元運動序列;
(5)基于DMP算法對每個運動基元建立基元軌跡模型,控制機械臂執行基元軌跡;
步驟(3)包括:利用維特比算法將最優模型下最可能的隱狀態分布路徑作為基元運動序列,并建立基元運動庫;其中,O代表觀測數據序列,Q代表該模型下所有可能的隱狀態路徑集合,λ代表模型參數集;
步驟(4)中,所述HSMM新型前向概率定義為:
其中,αt(j,d)代表t時刻隱狀態為j且隱狀態持續時間已經為d的概率,αt-d(i,h)代表在t-d時刻,模型隱狀態為i且隱狀態持續時間已經為h的概率;a(i,h)(j,d)代表在i狀態駐留時間為h轉移到j狀態且駐留時間為d的概率,bj,d(Ot-d+1:t)代表在j狀態下觀測到t-d+1至t時刻這段觀測值的概率;
所述濾波概率定義為:
其中,o1:t表示1到t時刻內的觀測值,S[t-d+1:t]=j代表t-d+1至t這段時刻隱狀態為j的概率,λ代表模型參數集,αt-d(i,h)代表在t-d時刻,模型隱狀態為i且隱狀態持續時間已經為h的概率;D代表每個隱狀態的駐留時間,α(i,h)(j,d+k)代表模型在隱狀態i駐留時間為h且轉移到隱狀態j駐留時間為d+k的概率,bj,d+k(Ot-d+1:t+k)代表在j狀態下觀測到t-d+1至t+k時刻這段觀測值的概率。
2.根據權利要求1所述的基于隱半馬爾可夫模型的機械臂控制方法,其特征在于,所述步驟(1)包括:
(11)獲取機械臂完成指定抓取動作的N組觀測數據,每組觀測數據對應一個隱狀態數目取值;
(12)建立HSMM模型,通過N組觀測數據訓練得到N個訓練模型;所述HSMM模型的參量包括:初始概率向量、狀態轉移概率矩陣、觀測概率矩陣、駐留時間矩陣、觀測序列長度和隱狀態個數。
3.根據權利要求1所述的基于隱半馬爾可夫模型的機械臂控制方法,其特征在于,所述步驟(2)包括:將滿足貝葉斯信息準則BIC=kln(ni)-2ln(Li),i=1,...,N且取值最大的訓練模型作為最優模型;其中,k代表訓練模型的參數個數,ni為第i個訓練模型的樣本數量,Li為第i個訓練模型的似然函數。
4.根據權利要求1所述的基于隱半馬爾可夫模型的機械臂控制方法,其特征在于,所述DMP算法為:其中y、分別代表系統運動位移、速度和加速度;g為系統運動目標值;ftarget是系統強迫項;τ為時間縮放因子;αy,βy是典型系統參數。
5.根據權利要求2所述的基于隱半馬爾可夫模型的機械臂控制方法,其特征在于,機械臂完成指定抓取動作的觀測數據包括:位姿、速度和加速度。
6.根據權利要求5所述的基于隱半馬爾可夫模型的機械臂控制方法,其特征在于:所述位姿包括機械臂各關節的位姿信息、機械手的位姿信息和被抓物體的位姿信息;所述速度包括機械臂各關節的速度信息和機械手的速度信息;所述加速度包括機械臂各關節的加速度信息和機械手的加速度信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010563175.9/1.html,轉載請聲明來源鉆瓜專利網。





