[發明專利]一種四足機器人自主運動控制學習方法在審
| 申請號: | 202310005616.7 | 申請日: | 2023-01-04 |
| 公開(公告)號: | CN115951580A | 公開(公告)日: | 2023-04-11 |
| 發明(設計)人: | 張曉平;吳宜通;王力;鄭遠鵬;孟祥鵬;張嘉林;馮輝;馬新雨 | 申請(專利權)人: | 北方工業大學 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 韓雪梅 |
| 地址: | 100144 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器人 自主 運動 控制 學習方法 | ||
1.一種四足機器人自主運動控制學習方法,其特征在于,包括:
由余弦振蕩器構成用于控制四足機器人所有關節角度的中樞模式發生器網絡;
根據四足機器人的運動狀態,采用深度強化學習方法對中樞模式發生器網絡的參數進行訓練,輸出四足機器人在當前運動狀態下中樞模式發生器網絡的最佳參數;
將所述最佳參數輸入中樞模式發生器網絡,輸出四足機器人每個關節的角度信號;
四足機器人根據每個關節的角度信號進行直線運動。
2.根據權利要求1所述的四足機器人自主運動控制學習方法,其特征在于,所述由余弦振蕩器構成用于控制四足機器人所有關節角度的中樞模式發生器網絡,具體包括:
四足機器人的每條腿有兩個關節,一個關節由一個余弦振蕩器控制,令一個中樞模式發生器單元控制四足機器人的一條腿,則由兩個余弦振蕩器構成的一個中樞模式發生器單元的數學表達式為其中,每條腿的兩個關節分別為髖關節和膝關節;
由四個中樞模式發生器單元構成的中樞模式發生器網絡的數學模型為
式中,y0、y1分別對應髖關節和膝關節處的余弦振蕩器輸出,A0、A1分別是兩個余弦振蕩器的幅值,T是周期,分別是髖關節和膝關節的初始相位;
式中,分別表示左前腿髖關節、左前腿膝關節、左后腿髖關節、左后腿膝關節、右前腿髖關節、右前腿膝關節、右后腿髖關節和右后腿膝關節的角度;Ah、Ak分別是髖關節和膝關節的幅值;t0,…,t7分別是各關節的時差,2πt0/T,…,2πt7/T分別是各關節之間的相位差,t表示時間。
3.根據權利要求2所述的四足機器人自主運動控制學習方法,其特征在于,所述深度強化學習的觀測空間選取的是四足機器人運動過程中的17個狀態量,包括:四足機器人的俯仰角、橫滾角和偏航角;四足機器人重心相對于地球坐標系的x,y,z坐標位置;四足機器人8個關節的角度;以及四足機器人在x,y,z坐標系方向上的運動速度Vx,Vy,Vz;
動作空間:動作空間是n維的,n的大小與中樞模式發生器網絡參數的個數相同;動作空間直接輸出中樞模式發生器網絡的參數,包括:Ah、Ak、T、t0,…,t7;
狀態空間:狀態空間與觀測空間選取相同;
獎勵函數:其中,reward表示總獎勵函數;rewardstep表示每走一步的獎勵,rewardstep=10;rewardx表示x軸方向運動獎勵,rewardx=w2(x-xlast),ω2表示第二權重,x表示當前時刻機體重心x坐標,xlast表示前一時刻機體重心x坐標;rewardy表示y軸方向運動獎勵,rewardy=w1(y-ylast),ω1表示第一權重,y表示當前時刻機體重心y坐標,ylast表示前一時刻機體重心y坐標;rewardpitch表示機器人的俯仰角獎勵,rewardpitch=w3α,ω3表示第三權重,α表示俯仰角;rewardroll表示機器人的橫滾角獎勵,rewardroll=w3β,β表示橫滾角;rewardyaw表示機器人的偏航角獎勵,rewardyaw=w4γ,ω4表示第四權重,γ表示偏航角;rewardyaw表示機器人摔倒獎勵,f表示機器人摔倒獎勵函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北方工業大學,未經北方工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310005616.7/1.html,轉載請聲明來源鉆瓜專利網。





