[發明專利]一種基于深度學習的雙臂機器人仿人作業規劃方法有效
| 申請號: | 202010081726.8 | 申請日: | 2020-02-06 |
| 公開(公告)號: | CN111230875B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 請求不公布姓名 | 申請(專利權)人: | 北京凡川智能機器人科技有限公司 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100036 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 雙臂 機器人 作業 規劃 方法 | ||
本發明提供了一種基于深度學習的雙臂機器人仿人作業規劃方法,包括如下步驟:步驟S1,訓練策略網絡;所述策略網絡能夠根據機械臂當前狀態和目標狀態計算下一時刻機械臂處于各狀態的概率,給出多種運動方案;步驟S2,確定評價函數;所述評價函數用于對所述策略網絡提供的運動方案進行評估;步驟S3,結合所述策略網絡和所述評價函數執行樹搜索,得到機械臂路徑規劃的結果。本發明利用人類運動動作樣本作為指導,同時結合當前機器人所處的具體環境對人類運動動作樣本進行選擇或改變,從而實現雙臂機器人進行仿人作業規劃。
技術領域
本發明涉及一種機器人的機械臂作業規劃方法,具體涉及一種基于深度學習的雙臂機器人仿人作業規劃方法,屬于機器人技術領域。
背景技術
在武警公安反恐防暴、戰場作戰、有害氣體及核輻射等危險復雜的作業環境中,路徑規劃主要考慮的是機器人如何能從初始狀態無碰撞地運動到目標狀態的問題,路徑規劃的技術水平是衡量機器人智能化程度的重要指標。由于人類具有強大的學習能力,通過不斷的運動學習與不同環境的適應訓練積累大量的運動動作樣本。在執行與之前相似的運動任務時,依據動作樣本,根據實際環境稍加改變便可以快速有效地完成所需的運動動作。
現有的路徑規劃方法主要有基于圖的路徑規劃算法例如A*算法、可視圖法、人工勢場算法,以及基于隨機采樣的概率路圖算法(PRM)和快速擴展隨機樹算法(RRT)等。
由于機械臂相對于移動機器人來說維度較高,傳統的路徑規劃算法存在計算量太大,障礙物難以描述,算法不完備,不最優等問題,基于采樣的規劃算法滿足概率完備,但由于采樣引入了一定的隨機性,每次規劃結果都可能不相同,存在規劃結果無法預判的問題。
基于這一問題,本領域需要一種利用人類運動動作樣本作為指導,另一方面結合當前機器人所處的具體環境對人類運動動作樣本進行選擇或改變,從而實現雙臂機器人進行仿人作業規劃的方法。
發明內容
本發明的目的在于提供一種既能將人類運動動作作為機器人運動規劃的指導,同時也能考慮機器人當前所處的具體環境的運動規劃方法。
本發明的技術方案如下。
本發明第一方面提供了一種基于深度學習的雙臂機器人仿人作業規劃方法,包括如下步驟:
步驟S1,訓練策略網絡;所述策略網絡能夠根據機械臂當前狀態和目標狀態計算下一時刻機械臂處于各狀態的概率,給出多種運動方案
步驟S2,確定評價函數;所述評價函數用于對所述策略網絡提供的運動方案進行評估;
步驟S3,結合所述策略網絡和所述評價函數執行樹搜索,得到機械臂路徑規劃的結果。
優選地,所述策略網絡采用人類運動動作樣本。
優選地,所述人類運動動作樣本通過運動捕捉設備獲取。
優選地,所述評價函數用于評估從機械臂從當前狀態運動到下一時刻各狀態的代價。
優選地,所述評價函數還用于評估運動過程中機械臂是否與自身和周圍環境發生碰撞。
優選地,所述樹搜索將機械臂的每個運動狀態視作樹的一個節點;通過所述策略網絡對機械臂的運動進行多步擴展得到樹的多個節點,根據所述評價函數對擴展的葉節點進行評估,并從葉節點回傳更新各根節點的值,最終根據各節點的值選取最優節點作為機械臂路徑規劃的結果。
優選地,所述步驟S3進一步包括:
步驟S31,選擇步驟;根據策略網絡得到的人類可能的運動動作,選擇其中概率較大的動作q;
步驟S32,擴展步驟;在動作q之后,繼續利用策略網絡選擇概率較大的子節點對樹進行擴展,得到多個子樹,擴展一定步數之后停止;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京凡川智能機器人科技有限公司,未經北京凡川智能機器人科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010081726.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種面條和面片的蒸面工藝
- 下一篇:自動駕駛變道路徑規劃方法、裝置和電子設備





