[發明專利]一種人機協同輔助行走機器人的運動控制方法在審
| 申請號: | 202011178097.7 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112230543A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 蘆穎僖;侯禮春;周亞瑞 | 申請(專利權)人: | 南京凌華微電子科技有限公司 |
| 主分類號: | G05B13/02 | 分類號: | G05B13/02 |
| 代理公司: | 江蘇圣典律師事務所 32237 | 代理人: | 龔擁軍 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 人機 協同 輔助 行走 機器人 運動 控制 方法 | ||
1.一種人機協同輔助行走機器人的運動控制方法,其特征在于,包括以下步驟:
步驟S1:更新激光雷達傳感器、編碼器和力傳感器的數據,得到障礙物距離d、用戶左右腳和機器人的相對距離DHL和DHR、機器人的當前速度RVcurrent和用戶輸入到機器人的力Fs;
步驟S2:使用用戶運動期望估計到目標的距離和時間相除,來計算用戶的期望速度
步驟S3:根據障礙物距離d和機器人的當前速度RVcurrent計算機器人規劃速度RVrobot,當障礙物和機器人的距離d小于1m時,機器人會規劃向左、右變換移動來避開降礙物;
步驟S4:根據用戶的操作表現和行走環境,使用機器學習算法計算用戶控制權重kuser,通常設置kuser=0.35~0.65之間;
步驟S5:使用協同控制算法通過機器人規劃速度RVrobot和用戶期望速度得到機器人最終運動控制速度RV。
2.根據權利要求1所述的人機協同輔助行走機器人的運動控制方法,其特征在于,步驟S5中所述的協同控制算法為:
kuser=1-krobot (2)
其中協同控制的輸出為坐標系{R}中的機器人最終運動控制速度,為坐標系{R}中的用戶期望速度,為坐標系{R}中的機器人規劃速度,X、Y、θ分別為平面的橫坐標、縱坐標、及坐標夾角;kuser是用戶控制權重,krobot是輔助機器人控制權重。
3.根據權利要求1所述的人機協同輔助行走機器人的運動控制方法,其特征在于,為提高舒適性和安全性,定義兩個影響用戶操控表現的因子:安全因子和平順因子。
4.根據權利要求3所述的人機協同輔助行走機器人的運動控制方法,其特征在于,在機器學習算法過程中將這兩個因子考慮進去設計輸出函數,當用戶和機器人發生交互行為時,機器人更新當前時間t的狀態變量si=(d,Δvx,Δvy,Δω),其中d為最近的障礙物和機器人之間的距離,Δvx,Δvy,Δω為用戶期望速度和當前機器人速度之間的差值,在交互行為產生后,得到一個基于用戶運動期望、機器人當前狀態和周圍環境信息來計算機器人的立即輸出的輸出值,輸出值函數表示為:
ri=c1|d|-c2|Δvx|-c3|Δvγ|-c4|Δω| (6)
其中c1,c2,c3和c4為正常數。
5.根據權利要求3或4所述的人機協同輔助行走機器人的運動控制方法,其特征在于,機器學習方法使用實際的觀測數據(si,ai)和(si+1,ai+1)來更新行為值函數的估計值,機器學習的值函數估計的更新公式為
Qi(si,ai)=Q(si,ai)+ai[r(si,ai)+γQ(si+1,ai+1)-Q(si,ai)] (3)
其中ai是學習因子,反映了學習的速度;γ為折扣因子,反映了未來輸出的折扣率。
6.根據權利要求5所述的人機協同輔助行走機器人的運動控制方法,其特征在于,在完成學習階段后,機器人更新數據組{si,ai,ri},由于機器學習中狀態信息和行為為離散的,而實際得到的是連續數據,將連續數據離散化來避免計算維數爆炸,將這些數據壓縮到Q{si,ai}中,Q{si,ai}為根據行為選擇策略π選擇執行行為ai后,狀態si得到的累計輸出值,而Q{si,ai}的更新是根據公式(3)來進行的:
Qi(si,ai)=Q(si,ai)+ai[r(si,ai)+γQ(si+1,ai+1)-Q(si,ai)] (3)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京凌華微電子科技有限公司,未經南京凌華微電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011178097.7/1.html,轉載請聲明來源鉆瓜專利網。





