[發明專利]一種基于深度強化學習的機器人旋擰閥門系統及方法有效
| 申請號: | 202110056826.X | 申請日: | 2021-01-15 |
| 公開(公告)號: | CN112894808B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 宋銳;尹心彤;李鳳鳴;劉義祥;李貽斌 | 申請(專利權)人: | 山東大學 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張慶騫 |
| 地址: | 250061 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 強化 學習 機器人 閥門 系統 方法 | ||
本發明屬于深度學習領域,提供了一種基于深度強化學習的機器人旋擰閥門系統及方法。其中,該系統包括深度相機,其用于采集閥門圖像并傳送至控制器;六維力傳感器,其用于采集旋擰閥門過程中的機械臂末端力/力矩信息并傳送至控制器;末端執行器,其位于機器臂本體末端,用于帶動閥門旋轉;控制器,其用于接收閥門圖像并提取閥門特征,解算出閥門位姿;根據閥門位姿,控制機械臂運動至旋擰閥門的初始期望作業位置,并使得機械臂處于期望初始姿態;根據機械臂當前姿態和機械臂末端當前力/力矩信息獲取當前旋擰狀態,再基于深度強化學習的機器人旋擰閥門模型,輸出機械臂動作決策指令。
技術領域
本發明屬于深度學習領域,尤其涉及一種基于深度強化學習的機器人旋擰閥門系統及方法。
背景技術
本部分的陳述僅僅是提供了與本發明相關的背景技術信息,不必然構成在先技術。
當前機器人旋擰閥門任務中,采用機械臂末端執行器抓握閥柄的方式進行閥門旋擰,由于機械臂末端執行器與閥門位置不能精確匹配,往往會在閥門轉動過程中產生內力,且這種方式還涉及旋擰路徑的規劃問題;末端執行器插入閥門手輪轉動的旋擰方法會帶來末端工具軸線相對閥門手輪軸線的偏差,且不能很好地跟蹤閥門轉動過程中的軸向位移,這些問題會造成閥門乃至機械臂的損壞,最終導致旋擰任務的失敗。
發明內容
為了解決上述背景技術中存在的至少一項技術問題,本發明提供一種基于深度強化學習的機器人旋擰閥門系統及方法,其在閥門旋擰過程中融合機械臂末端位姿和力/力矩信息,通過構建的機器人旋擰閥門模型自適應調整機械臂末端位姿,進而實現閥門旋擰。
為了實現上述目的,本發明采用如下技術方案:
本發明的第一個方面提供一種基于深度強化學習的機器人旋擰閥門系統。
一種基于深度強化學習的機器人旋擰閥門系統,包括:
深度相機,其用于采集閥門圖像并傳送至控制器;
六維力傳感器,其用于采集旋擰閥門過程中的機械臂末端力/力矩信息并傳送至控制器;
末端執行器,其位于機器臂本體末端,用于帶動閥門旋轉;
控制器,其用于:
接收閥門圖像并提取閥門特征,解算出閥門位姿;
根據閥門位姿,控制機械臂運動至旋擰閥門的初始期望作業位置,并使得機械臂處于期望初始姿態;
根據機械臂當前姿態和機械臂末端當前力/力矩信息獲取當前旋擰狀態,再基于深度強化學習的機器人旋擰閥門模型,輸出機械臂動作決策指令。
作為一種實施方式,機械臂動作決策指令包括機械臂位置調整大小和姿態偏轉角度。
作為一種實施方式,所述控制器,還用于通過逆運動學求解各關節角,控制機械臂進行相應的姿態和位置調整,以至在旋擰過程中末端工具軸線相對閥門手輪軸線相重合且以恒力跟蹤閥門軸向位置,保證旋擰過程順利進行并完成整個閥門旋擰過程。
作為一種實施方式,機械臂的期望初始姿態為:末端執行器軸線垂直于閥門所在平面,且與閥門軸線重合,旋擰插進閥門手輪內。
作為一種實施方式,所述六維力傳感器安裝在機械臂末端法蘭盤上,介于第六臂與末端執行器之間。
作為一種實施方式,所述控制器,還用于根據提取的閥門特征來判斷閥門關閉狀態;若閥門關閉,則結束作業;若未關閉,則繼續進行旋擰作業。
作為一種實施方式,所述控制器,還用于評價旋擰過程是否完成:當末端執行器z向位移不小于閥門關閉所需軸向位移,且檢測z軸向受力不小于所設力閾值時,閥門關閉,結束旋擰過程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110056826.X/2.html,轉載請聲明來源鉆瓜專利網。





