[發明專利]一種四足機器人腿部運動的步態規劃方法有效
| 申請號: | 201911055589.4 | 申請日: | 2019-10-31 |
| 公開(公告)號: | CN110764415B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 劉厚德;于天寧;王學謙;梁斌;朱曉俊;高學海 | 申請(專利權)人: | 清華大學深圳國際研究生院 |
| 主分類號: | G05D1/08 | 分類號: | G05D1/08 |
| 代理公司: | 深圳新創友知識產權代理有限公司 44223 | 代理人: | 江耀純 |
| 地址: | 518055 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器人 腿部 運動 步態 規劃 方法 | ||
本發明提供一種四足機器人腿部運動的步態規劃方法,包括如下步驟:S1:在機器人仿真平臺下搭建四足機器人腿部的模型;S2:篩選神經網絡訓練所述模型的強化學習策略;S3:設定和試探所述強化學習策略的獎懲函數、狀態輸入與訓練條件;S4:基于所述獎懲函數、所述狀態輸入與所述訓練條件訓練所述模型并分別展示所述模型的搖擺相和支持相的運動效果來展示所述神經網絡的訓練結果。通過采用強化學習算法,利用啟發式的學習訓練方案,不僅對腿部運動學進行規劃,并且可以令機器人在這一算法網絡下,自適應地調整步態。
技術領域
本發明涉及足機器人技術領域,尤其涉及一種四足機器人腿部運動的步態規劃方法。
背景技術
在傳統的四足機器人模型中,四足機器人一般具有相同或者鏡像的四條腿部,每一條腿具有三個自由度,分別由三個驅動器控制,分別為髖關節橫截面驅動器、髖關節矢平面驅動器與膝關節矢平面驅動器。
在早期的運動規劃領域中,一般建立單足Jacobi矩陣對足機器人末端位置進行求解或者利用該矩陣對其進行逆運動學求解。然而該方法具有以下缺點:1、建立Jacobi矩陣較為繁瑣不利于人工求解與電腦計算。2、根據該方法進行逆運動學求解會出現臂型奇異,需要人工剔除不可能的關節角。3、一旦腿部偏離了預定軌跡或者預定點,這種偏差將難以消除,并在之后的運動中逐漸累積,直至影響四足機器人平穩運動。
現有技術中缺乏一種自適應性的四足機器人的步態規劃方法。
以上背景技術內容的公開僅用于輔助理解本發明的構思及技術方案,其并不必然屬于本發明申請的現有技術,在沒有明確的證據表明上述內容在本發明申請的申請日已經公開的情況下,上述背景技術不應當用于評價本申請的新穎性和創造性。
發明內容
本發明為了解決現有中缺乏一種自適應性的四足機器人的步態規劃方法問題,提供一種四足機器人腿部運動的步態規劃方法。
為了解決上述問題,本發明采用的技術方案如下所述:
一種四足機器人腿部運動的步態規劃方法,包括如下步驟:S1:在機器人仿真平臺下搭建四足機器人腿部的模型;S2:篩選神經網絡訓練所述模型的強化學習策略;S3:設定和試探所述強化學習策略的獎懲函數、狀態輸入與訓練條件;S4:基于所述獎懲函數、所述狀態輸入與所述訓練條件訓練所述模型并分別展示所述模型的搖擺相和支持相的運動效果來展示所述神經網絡的訓練結果。
優選地,所述仿真平臺是V-REP平臺。
優選地,采用深度確定性策略梯度強化學習算法,所述神經網絡包括兩個相同的演員神經網絡和兩份相同的評論家網絡;所述演員神經網絡一個是評估網絡,另一個是目標網絡,當訓練積累到一定次數后將所述目標網絡賦值到所述評估網絡;所述評論家網絡一個是評估網絡一個目標網絡,當訓練積累到一定次數后將目標網絡賦值到評估網絡。
優選地,所述評論家網絡為三層神經網絡,每層具有500個神經元;所述演員神經網絡為四層神經網絡,輸入層、中間層每層具有500個神經元,輸出層具有2個神經元。
優選地,所述神經網絡訓練的輪次為500。
優選地,所述獎懲函數如下所示:
其中,x、z為所述四足機器人的足端在X方向與Z方向上的坐標,xt、zt為目標點在X方向與Z方向上的坐標。
優選地,選取一個9維狀態值作為輸入,對輸入值的定義為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學深圳國際研究生院,未經清華大學深圳國際研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911055589.4/2.html,轉載請聲明來源鉆瓜專利網。





