[發(fā)明專利]抗擾動模型訓練、控制方法、裝置、設備、機器人及介質有效
| 申請?zhí)枺?/td> | 202011134929.5 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112276950B | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設計)人: | 冷曉琨;常琳;何治成;白學林;柯真東;王松;吳雨璁;黃賢賢 | 申請(專利權)人: | 樂聚(深圳)機器人技術有限公司 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 曹瑞敏 |
| 地址: | 518110 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 擾動 模型 訓練 控制 方法 裝置 設備 機器人 介質 | ||
1.一種抗擾動模型的訓練方法,其特征在于,包括:
獲取機器人的訓練狀態(tài)信息,所述訓練狀態(tài)信息用于指示所述機器人在訓練過程中受擾動后的狀態(tài);
根據所述訓練狀態(tài)信息,采用具有多種預設抗擾動策略的抗擾動模型進行處理,得到所述多種預設抗擾動策略的訓練控制參數;
獲取所述機器人基于所述多種預設抗擾動策略的訓練控制參數進行動作控制后的抗擾動結果;
根據所述抗擾動結果,對所述抗擾動模型的網絡參數進行更新,得到目標抗擾動模型;
所述獲取機器人的訓練狀態(tài)信息,包括:
獲取所述機器人受擾動后的訓練質心狀態(tài)、訓練腳掌狀態(tài)和訓練關節(jié)狀態(tài),所述訓練狀態(tài)信息包括:訓練質心狀態(tài)、訓練腳掌狀態(tài)和訓練關節(jié)狀態(tài);
所述獲取所述機器人受擾動后的質心狀態(tài)、腳掌狀態(tài)和訓練關節(jié)狀態(tài),包括:
獲取所述機器人的關節(jié)編碼器所檢測的訓練關節(jié)角度;
獲取所述機器人的陀螺儀檢測的訓練軀干傾角;
根據所述訓練關節(jié)角度和所述訓練軀干傾角,計算訓練質心位置、訓練質心速度和訓練腳掌傾角;其中,所述訓練質心狀態(tài)包括:訓練質心位置、訓練質心速度;
獲取所述機器人的足底壓力傳感器檢測的訓練腳掌壓力,其中,所述訓練腳掌狀態(tài)包括:所述訓練腳掌傾角和所述訓練腳掌壓力;
通過所述機器人的電機的電流檢測訓練髖關節(jié)扭矩和訓練踝關節(jié)扭矩,所述訓練關節(jié)狀態(tài)包括:所述訓練髖關節(jié)扭矩和所述訓練踝關節(jié)扭矩。
2.如權利要求1所述的方法,其特征在于,所述多種預設抗擾動策略包括如下至少兩種策略:踝關節(jié)抗擾動策略、髖關節(jié)抗擾動策略、邁步抗擾動策略。
3.如權利要求1所述的方法,其特征在于,所述根據所述抗擾動結果,對所述抗擾動模型的網絡參數進行更新,得到目標抗擾動模型,包括:
根據所述抗擾動結果,采用預設獎勵函數,計算獎勵函數值;
更新所述抗擾動模型的網絡參數,直至基于更新參數后的所述抗擾動模型所得到的獎勵函數值滿足預設結束條件,得到所述目標抗擾動模型。
4.如權利要求3所述的方法,其特征在于,所述抗擾動結果包括:軀干角速度信息和軀干傾角信息;
所述根據所述抗擾動結果,采用預設獎勵函數,計算獎勵函數值,包括:
根據所述軀干角速度信息、所述軀干傾角信息、軀干質心與地面的高度,采用預設獎勵函數,計算獎勵函數值。
5.如權利要求1所述的方法,其特征在于,所述獲取機器人的訓練狀態(tài)信息,包括:
通過所述機器人的仿真環(huán)境獲取所述機器人的訓練狀態(tài)信息;
所述獲取所述機器人基于所述多種預設抗擾動策略的訓練控制參數進行動作控制后的抗擾動結果,包括:
通過所述機器人的仿真環(huán)境獲取所述機器人基于所述多種預設抗擾動策略的訓練控制參數進行動作控制后的抗擾動結果。
6.一種機器人抗擾動控制方法,其特征在于,所述方法包括:
獲取機器人的應用狀態(tài)信息,所述應用狀態(tài)信息用于指示所述機器人在應用過程中受擾動后的狀態(tài);
根據所述應用狀態(tài)信息,采用預先訓練的具有多種預設抗擾動策略的抗擾動模型進行處理,得到所述多種預設抗擾動策略的運動控制參數;其中,所述抗擾動模型為采用上述權利要求1-5任一所述方法訓練得到的目標抗擾動模型;
根據所述多種預設抗擾動策略的運動控制參數,計算得到所述機器人中各關節(jié)的控制信息;
根據所述機器人中各關節(jié)的控制信息,控制所述機器人進行抗干擾運動。
7.根據權利要求6所述的方法,其特征在于,所述多種預設抗擾動策略包括如下至少兩種策略:踝關節(jié)抗擾動策略、髖關節(jié)抗擾動策略、邁步抗擾動策略;
所述根據所述多種預設抗擾動策略的運動控制參數,計算得到所述機器人中各關節(jié)的控制信息,包括:
根據所述至少兩種策略的運動控制參數,分別計算所述至少兩種策略對應關節(jié)的運動軌跡;
根據所述至少兩種策略對應關節(jié)的運動軌跡,采用運動學逆解算法進行逆解運算,得到所述機器人中各關節(jié)的控制信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于樂聚(深圳)機器人技術有限公司,未經樂聚(深圳)機器人技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011134929.5/1.html,轉載請聲明來源鉆瓜專利網。





