[發明專利]機械臂的控制方法、裝置及人機協同模型的訓練方法有效
| 申請號: | 202011159428.2 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112428278B | 公開(公告)日: | 2022-11-15 |
| 發明(設計)人: | 段星光;田煥玉;溫浩;田野;靳勵行;孟繁盛 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | B25J11/00 | 分類號: | B25J11/00;B25J9/16;B25J18/00 |
| 代理公司: | 成都方圓聿聯專利代理事務所(普通合伙) 51241 | 代理人: | 鄧永紅 |
| 地址: | 100081 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機械 控制 方法 裝置 人機 協同 模型 訓練 | ||
1.一種機器人,其特征在于,包括:機械臂、傳感器、至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的計算機程序,所述計算機程序被所述至少一個處理器執行,以使所述至少一個處理器執行機械臂的控制方法和/ 或人機協同模型的訓練方法;
所述機械臂的控制方法,包括:
獲取人機協同模型,其中所述人機協同模型為根據人機交互力確定機械臂期望位姿的模型,通過機器學習方法進行訓練得到人機協同模型;訓練人機協同模型的模型輸入可以為當前時刻的人機交互力和機械臂當前時刻位姿的采樣值,也可以為當前時刻的人機交互力和機械臂期望位姿的采樣值,并根據模型輸入的采樣值對人機協同模型進行訓練;
獲取當前時刻位姿,根據所述人機協同模型獲取當前時刻人機交互力對應的期望位姿;
根據所述當前時刻位姿和所述當前時刻人機交互力對應的期望位姿生成機械臂運動的最優軌跡;
根據所述最優軌跡對機械臂進行控制;
所述最優軌跡的特征是操作者在切線方向上可以控制前進、后退;但法線方向上由機器人自主控制;
所述根據所述當前時刻位姿和所述當前時刻人機交互力對應的期望位姿生成機械臂運動的最優軌跡包括:
通過模型預測控制MPC算法,根據所述當前時刻位姿和所述當前時刻人機交互力對應的期望位姿,生成多組隨機軌跡;
從所述多組隨機軌跡中選擇最優軌跡;
所述從所述多組隨機軌跡中選擇最優軌跡包括:
從所述多組隨機軌跡,通過最優軌跡控制算法,選擇最優軌跡;
所述根據所述最優軌跡對機械臂進行控制,包括:
獲取機械臂的位置及姿態角運動信息;
對機械臂的位置及姿態角運動信息的法向分量,進行第一模式控制;
對機械臂的位置及姿態角運動信息的切向分量,進行第二模式控制;其中,所述第一模式為機械臂導納大于所述第二模式的機械臂導納的機器人引導模式;所述第二模式為人類導納大于所述第一模式的人類導納的人類引導模式;
根據機器人動力學,通過機械臂實際運動的阻抗坐標系和機械臂期望運動的期望坐標系構建機械臂的誤差反饋量,如式所示:
其中,M(q)為機械臂在笛卡爾空間下的慣性矩陣,矩陣前三列單位為kg,后面所有的元素單位為Ns2/rad;q為關節角;x前三行單位為m,后面所有行對應的單位為rad;為粘滯矩陣;g(q)為重力向量;fenv為環境交互力旋量,可以通過環境-機械臂交互的力傳感器獲取;f為人機交互力;
所述人機協同模型的訓練方法包括:
在信賴區域下獲取機械臂的多組人機交互力和所述多組人機交互力對應的多組機械臂位姿,其中,信賴區域是指為獲取的人機交互力的力傳感器的采樣分布ps在預設KL散度閾值之間的區域,其中,KL散度指ps和人機協同模型之間的KL散度,如式所示,KL散度可以表達為:
DKL(ps,pm)≤thKL
其中,ps為力傳感器的采樣分布,ps由最大似然估計得到;pm為人機協同模型的模型分布,thKL為第一預設KL散度閾值,可以由用戶進行設定,也可以由人機協同模型由機器學習方法通過用戶在不同人機阻抗力的學習得到;
所述多組人機交互力和所述多組機械臂位姿,建立人機協同模型之后,所述方法還包括:
利用監督學習方法對人機協同模型的參數進行優化包括采用先驗信息,具體的,利用監督學習方法中的最大似然原理,對人機協同模型的參數進行優化,如式所示,優化后的訓練模型的對應參數為:
其中,pm為人機協同模型的模型分布,fh為通過力傳感器獲取的人機交互力,xd為機械臂位姿,t為當前時刻,t+1為下一時刻,θC為人機協同模型的參數,具體的,當人機協同模型為GMM時,θC為分模型序號;當人機協同模型為神經網絡模型時,θC為連接節點無量綱權重;
所述機械臂的控制裝置,包括:
模型獲取模塊,用于獲取人機協同模型,其中所述人機協同模型為根據人機交互力確定機械臂期望位姿的模型;
位姿獲取模塊,用于獲取當前時刻位姿,根據所述人機協同模型獲取當前時刻人機交互力對應的期望位姿;
軌跡生成模塊,用于根據所述當前時刻位姿和所述當前時刻人機交互力對應的期望位姿生成機械臂運動的最優軌跡;
控制模塊,用于根據所述最優軌跡對機械臂進行控制;
所述軌跡生成模塊包括:
隨機軌跡生成單元,用于通過MPC算法,根據所述當前時刻位姿和所述當前時刻人機交互力對應的期望位姿,生成多組隨機軌跡;
最優軌跡生成單元,從所述多組隨機軌跡中選擇最優軌跡;
所述機器人還包括,計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機指令,所述計算機指令用于使所述計算機執行所述的機械臂的控制方法和/或人機協同模型的訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011159428.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內嵌式推力調節固體發動機
- 下一篇:無變壓器交-直-交三相不停電電源





