[發(fā)明專利]機器人三維運動空間動作模仿學習方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201910976460.0 | 申請日: | 2019-10-15 |
| 公開(公告)號: | CN110900598B | 公開(公告)日: | 2022-09-23 |
| 發(fā)明(設計)人: | 任明侖;馬媛媛 | 申請(專利權)人: | 合肥工業(yè)大學 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 北京久誠知識產(chǎn)權代理事務所(特殊普通合伙) 11542 | 代理人: | 余罡 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器人 三維 運動 空間 動作 模仿 學習方法 系統(tǒng) | ||
本發(fā)明提供一種機器人三維運動空間動作模仿學習方法和系統(tǒng),涉及人工智能和機器人技術領域。本發(fā)明設計了一種基于串并聯(lián)疊層BP神經(jīng)網(wǎng)絡的機器人三維空間動作模仿學習方法,將模仿學習機制應用于機器人學習系統(tǒng),在模仿學習機制的流程框架下,通過將機械臂產(chǎn)生的示教信息傳遞至表示運動策略的串并聯(lián)疊層BP神經(jīng)網(wǎng)絡模型來進行訓練學習。通過學習運動的狀態(tài)特征矩陣集合和運動的動作特征矩陣集合之間的對應關系,不僅可以再現(xiàn)示教動作,還能夠對動作行為進行泛化,在面對不同的任務時,不需要分別進行動作規(guī)劃,具有較高的智能性。
技術領域
本發(fā)明涉及人工智能技術領域,具體涉及一種機器人三維運動空間動作模仿學習方法和系統(tǒng)。
背景技術
隨著時代的發(fā)展和人工智能的普及,以及人們對生活質量要求的提高,服務機器人特別是家庭服務機器人近年來需求增長迅速。服務機器人需要面臨復雜的工作環(huán)境并且與人共享三維空間,更重要的是,這類機器人服務的對象是數(shù)量更加龐大的非專業(yè)人群。
目前,對于機器人在三維空間動作模仿學習方面的研究主要包括兩個階段,第一階段是如何演示以及收集示教案例;第二階段是如何從示例中獲取策略并學習什么樣的策略?,F(xiàn)有技術中,在第一階段主要采用“手把手”示教的學習形式,第二階段采用學習狀態(tài)到動作的映射策略和學習獎勵函數(shù)來得到運動策略。
然而,學習狀態(tài)到動作的映射策略所運用的一些方法很難運用于三維空間冗余機械臂的動作學習,學習獎勵函數(shù)的方法將每個技能分開來學習,學會了模仿一個技能并不能更加快速地學習模仿下一個技能。導致目前的機器人在三維空間動作模仿學習方面的智能性較低。
發(fā)明內(nèi)容
(一)解決的技術問題
針對現(xiàn)有技術的不足,本發(fā)明提供了一種機器人三維運動空間動作模仿學習方法和系統(tǒng),解決了現(xiàn)有技術中機器人在三維空間動作模仿學習方面智能性低的技術問題。
(二)技術方案
為實現(xiàn)以上目的,本發(fā)明通過以下技術方案予以實現(xiàn):
本發(fā)明提供一種機器人三維運動空間動作模仿學習方法,包括以下步驟:
基于機器人的機械臂工作空間要求,劃分三維運動空間;獲取示教過程中的三維運動空間內(nèi)的機械臂關節(jié)角角度狀態(tài)信息、末端位置狀態(tài)信息和特征信息;
基于所述機械臂關節(jié)角度狀態(tài)信息和末端位置狀態(tài)信息構建機械臂系統(tǒng)狀態(tài)空間模型;
基于機械臂系統(tǒng)狀態(tài)空間模型和特征信息,獲取機械臂運動的狀態(tài)特征矩陣集合和動作特征矩陣集合;
基于所述機械臂運動的狀態(tài)特征矩陣集合、機械臂運動的動作特征矩陣集合和預先構建的串并聯(lián)疊層BP神經(jīng)網(wǎng)絡模型獲取動作模仿學習的串并聯(lián)疊層BP神經(jīng)網(wǎng)絡模型;
獲取實時目標任務的機械臂運動的狀態(tài)特征矩陣集合,基于所述串并聯(lián)疊層BP神經(jīng)網(wǎng)絡模型和實時目標任務的機械臂運動的狀態(tài)特征矩陣集合,獲取實時目標任務的機械臂運動的動作特征矩陣集合,機械臂通過關節(jié)轉動,執(zhí)行所述目標任務的機械臂運動的動作特征矩陣集合限定的動作。
優(yōu)選的,所述特征信息包括機械臂系統(tǒng)狀態(tài)信息和與任務相關的環(huán)境信息,其中:
機械臂系統(tǒng)狀態(tài)信息包括機械臂當前各關節(jié)角的角度狀態(tài)信息和機械臂末端點的位置狀態(tài)信息;
與任務相關的環(huán)境信息包括示教任務目標點在空間坐標系中的位置狀態(tài)信息。
優(yōu)選的,獲取機械臂運動的狀態(tài)特征矩陣集合和動作特征矩陣集合步驟之前,所述方法還包括:
選取與任務相關的特征信息中的特征參數(shù)構成特征矩陣集合,對特征矩陣集合進行預處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業(yè)大學,未經(jīng)合肥工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910976460.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種高導熱金屬基雙面鋁基覆銅板及其制備工藝
- 下一篇:譜峰位置的編碼與解碼





