[發(fā)明專利]一種基于演示軌跡的機(jī)器人裝配運動規(guī)劃方法在審
| 申請?zhí)枺?/td> | 202210515159.1 | 申請日: | 2022-05-12 |
| 公開(公告)號: | CN114800515A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計)人: | 湯卿;裘方舟 | 申請(專利權(quán))人: | 四川大學(xué) |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16;B25J9/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610065 四川*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 演示 軌跡 機(jī)器人 裝配 運動 規(guī)劃 方法 | ||
1.本發(fā)明提出了一種基于演示軌跡的機(jī)器人裝配運動規(guī)劃方法,其特征在于,該方法包括以下步驟:機(jī)器人演示學(xué)習(xí)階段:獲得機(jī)器人的裝配演示軌跡,機(jī)器人基于演示軌跡學(xué)習(xí)裝配操作技能;多模態(tài)的表征學(xué)習(xí)階段:機(jī)器人利用模仿學(xué)習(xí)策略引入噪聲與環(huán)境交互,獲得多模態(tài)的數(shù)據(jù)與標(biāo)簽,充分考慮機(jī)器人在運動過程中的耗能和奇異性,學(xué)習(xí)對應(yīng)的多模態(tài)數(shù)據(jù)的表征;機(jī)器人強(qiáng)化學(xué)習(xí)階段:基于多模態(tài)表征和演示軌跡搭建機(jī)器人軌跡規(guī)劃強(qiáng)化學(xué)習(xí)流程,強(qiáng)化學(xué)習(xí)訓(xùn)練獲得最終規(guī)劃策略。
2.根據(jù)權(quán)利要求1所述的一種基于演示軌跡的機(jī)器人裝配運動規(guī)劃方法,其特征在于,所述演示軌跡獲取方法為人工示教,通過示教拖動機(jī)器人的方式生成演示軌跡序列{τ1,τ2,...,τm},其中每個序列包含狀態(tài)和動作序列
3.根據(jù)權(quán)利要求1所述的一種基于演示軌跡的機(jī)器人裝配運動規(guī)劃方法,其特征在于,所述裝配操作技能學(xué)習(xí)具體步驟如下:1)將演示軌跡序列抽取成新的狀態(tài)動作對數(shù)據(jù)集:D={(s1,a1),(s2,a2),(s3,a3),...};2)構(gòu)建模仿學(xué)習(xí)策略網(wǎng)絡(luò),策略網(wǎng)絡(luò)架構(gòu)為三層全連接和Relu激活函數(shù),將狀態(tài)作為輸入,動作作為標(biāo)簽,利用回歸學(xué)得最優(yōu)策略模型。
4.根據(jù)權(quán)利要求1所述的一種基于演示軌跡的機(jī)器人裝配運動規(guī)劃方法,其特征在于,所述多模態(tài)數(shù)據(jù)與標(biāo)簽包括:固定相機(jī)獲得的RGB和深度圖像數(shù)據(jù),固定在機(jī)械臂末端的力-力矩傳感器數(shù)據(jù),機(jī)械臂關(guān)節(jié)位置、速度數(shù)據(jù),表征機(jī)器人瞬時速度的光流數(shù)據(jù),機(jī)器人運動過程中的碰撞數(shù)據(jù),機(jī)器人運動的耗能數(shù)據(jù);其中光流數(shù)據(jù)由圖像處理算法可以計算獲得,碰撞數(shù)據(jù)通過對力-力矩傳感器讀數(shù)進(jìn)行分析獲得,機(jī)器人運動的耗能數(shù)據(jù)通過計算電機(jī)的功率獲得。
5.根據(jù)權(quán)利要求1所述的一種基于演示軌跡的機(jī)器人裝配運動規(guī)劃方法,其特征在于,所述多模態(tài)表征獲得方式如下:
1)對多模態(tài)原始數(shù)據(jù)進(jìn)行特征提取,獲得RGB圖像特征、深度圖像特征、力-力矩特征和機(jī)器人本體特征;所述RGB圖像特征包括:128*128*3的RGB圖像通過VGG-16網(wǎng)絡(luò)編碼,并通過一個全連接層,得到128維高斯分布對應(yīng)的128*2個特征值;所述深度圖像特征包括:128*128*1的深度圖像通過VGG-16網(wǎng)絡(luò)編碼,并通過一個全連接層,得到128維高斯分布對應(yīng)的128*2個特征值;所述力-力矩特征包括:將32*6的力-力矩傳感器時間序列讀數(shù)通過步長為2的五層一維卷積編碼,并通過一個全連接層,得到128維高斯分布對應(yīng)的128*2個特征值;所述機(jī)器人本體特征包括:將關(guān)節(jié)位置速度通過兩層多層感知機(jī)編碼,得到128維高斯分布對應(yīng)的128*2個特征值;
2)根據(jù)概率圖模型,在已知多模態(tài)數(shù)據(jù)的情況下,各個模態(tài)間條件獨立;因此可以根據(jù)下式將各個模態(tài)的估計分布融合為一個聯(lián)合表征分布,
其中n表示模態(tài)數(shù),和μj分別聯(lián)合表征第j維的方差和均值;和μij則是第i個模態(tài)的單模態(tài)分布第j維的方差和均值;
3)聯(lián)合表征訓(xùn)練還需要利用動作輸入對機(jī)器人的運動做出估計,用以訓(xùn)練獲得良好的表征;其中包括:
基于碰撞的二分類預(yù)測,用于判斷機(jī)器人是否與裝配件發(fā)生接觸;
基于光流的反卷積解碼圖像預(yù)測,生成128*128*2的光流圖;
基于耗能的數(shù)值預(yù)測,用于估計機(jī)器人在當(dāng)前狀態(tài)采用當(dāng)前動作的耗能情況;
基于關(guān)節(jié)最大力矩的數(shù)值預(yù)測,用于量化估計機(jī)器人在空間的奇異化程度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川大學(xué),未經(jīng)四川大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210515159.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





