[發明專利]一種基于深度強化學習和阻抗控制的柔順人機接觸方法有效
| 申請號: | 202210484043.6 | 申請日: | 2022-05-05 |
| 公開(公告)號: | CN114789444B | 公開(公告)日: | 2022-12-16 |
| 發明(設計)人: | 舒明雷;張鐵譯;陳超;王若同;劉照陽 | 申請(專利權)人: | 山東省人工智能研究院;齊魯工業大學 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 濟南泉城專利商標事務所 37218 | 代理人: | 支文彬 |
| 地址: | 250013 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 強化 學習 阻抗 控制 柔順 人機 接觸 方法 | ||
1.一種基于深度強化學習和阻抗控制的柔順人機接觸方法,其特征在于,包括如下步驟:
a)根據柔順人機接觸任務,以機械臂底座建立機械臂坐標系,獲得執行器的初始位置坐標{Px,Py,Pz}及目標部位在機械臂坐標系下的位置坐標{Ox,Oy,Oz},Px為執行器的X軸坐標,Py為執行器的Y軸坐標,Pz為執行器的Z軸坐標,Ox為目標部位的X軸坐標,Oy為目標部位的Y軸坐標,Oz為目標部位的Z軸坐標;
b)通過深度強化學習算法建立狀態空間S和動作空間A,S={Px′,Py′,Pz′,Ox,Oy,Oz,Fx,Fy,Fz},式中Fx為執行器的X軸方向上的接觸力分力,Fy為執行器的Y軸方向上的接觸力分力,Fz為執行器的Z軸方向上的接觸力分力,Px′為執行器的實時位置的X軸坐標,Py′為執行器的實時位置的Y軸坐標,Pz′為執行器的實時位置的Z軸坐標;
c)對機械臂位姿進行初始化,初始化后執行器的實時位置坐標為{P′x,P′y,P′z},得到執行器初始位置與目標部位之間的距離di及執行器當前位置與目標部位之間的距離dc;
d)通過公式r1=(di-dc)/di計算得到基于距離的獎勵函數r1;
e)設定柔順人機在接觸任務中,執行器與目標接觸的接觸力在m-nN之內;
f)在距離身體距離為γ處設置虛擬接觸面;
g)通過公式l=|P′z-Oz|計算得到是否接觸到虛擬接觸面的判定條件值l;
h)當l>γ時,判定執行器未接觸到虛擬接觸面,狀態空間Fx,Fy,Fz均為0;
i)當0<l≤γ時,判定執行器接觸到虛擬接觸面,此時通過阻抗控制得到虛擬接觸力Fv,Fv=(F′x,F′y,F′z)T,F′x為執行器的X軸方向上的虛擬接觸力分力,Fy′為執行器的Y軸方向上的虛擬接觸力分力,Fz′為執行器的Z軸方向上的虛擬接觸力分力,T為轉置,將Fx′、Fy′及Fz′分別等同于狀態空間S中的Fx、Fy及Fz;
j)當執行器與身體發生接觸時,真實接觸力Fe≠0,此時停止對執行器的控制;步驟b)中通過公式A={ax,ay,az}建立動作空間,ax為執行器在機械臂坐標系下的X軸方向上的偏移量,ay為執行器在機械臂坐標系下的Y軸方向上的偏移量,az為執行器在機械臂坐標系下的Z軸方向上的偏移量;
步驟i)中通過公式計算得到虛擬接觸力Fv,式中Md、Bd、Kd均為阻抗參數,為執行器的速度,為執行器的加速度,λ為常數,I為向量,I=[0,0,1]T,Δx為執行器與目標部位之間的距離差,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東省人工智能研究院;齊魯工業大學,未經山東省人工智能研究院;齊魯工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210484043.6/1.html,轉載請聲明來源鉆瓜專利網。





