[發(fā)明專利]柔性機器人末端抵達控制方法、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010635603.4 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111783250A | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設(shè)計)人: | 孫俊;武海雷;韓飛;孫玥;劉超鎮(zhèn);陽光 | 申請(專利權(quán))人: | 上海航天控制技術(shù)研究所 |
| 主分類號: | G06F30/17 | 分類號: | G06F30/17;G06F30/27;G06N3/04;B25J9/16 |
| 代理公司: | 上海元好知識產(chǎn)權(quán)代理有限公司 31323 | 代理人: | 章麗娟;周乃鑫 |
| 地址: | 201109 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 柔性 機器人 末端 抵達 控制 方法 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開了一種柔性機器人末端抵達控制方法、電子設(shè)備和存儲介質(zhì),所述方法包括:建立柔性機器人的動力學(xué)模型;根據(jù)所述動力學(xué)模型建立深度神經(jīng)網(wǎng)絡(luò),所述深度神經(jīng)網(wǎng)絡(luò)用于擬合所述動力學(xué)模型;對所述深度神經(jīng)網(wǎng)絡(luò)進行第一次柔性機器人末端抵達過程的初步訓(xùn)練,得到所述深度神經(jīng)網(wǎng)絡(luò)的初始參數(shù);對所述深度神經(jīng)網(wǎng)絡(luò)進行第二次柔性機器人抵達過程的初步訓(xùn)練,得到所述深度神經(jīng)網(wǎng)絡(luò)的最終參數(shù)。本發(fā)明降低了柔性機器人的動力學(xué)模型的不確定性或外部擾動對控制系統(tǒng)的影響,提高了柔性機器人的末端控制精度。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,特別涉及一種基于深度強化學(xué)習(xí)的柔性機器人末端抵達控制方法、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
基于線纜變長度驅(qū)動的柔性機器人控制目標是在避免和周圍環(huán)境碰撞的條件下,實現(xiàn)柔性機器人末端的精確抵達。柔性機器人末端安全抵達控制過程中,會存在以下問題:一是由于柔性機器人由于其控制系統(tǒng)的復(fù)雜性、強非線性、時變和不確定性等特點,難以建立精確的動力學(xué)建模;二是柔性機器人運動過程中,線纜與卷盤和圓盤之間會存在摩擦等外界擾動。因此基于模型完全已知的經(jīng)典反饋控制方法難以有效抑制控制系統(tǒng)模型不確定和外界干擾帶來柔性機器人軌跡跟蹤控制不精確的問題,甚至導(dǎo)致控制系統(tǒng)不穩(wěn)定。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于深度強化學(xué)習(xí)的柔性機器人末端抵達控制方法、電子設(shè)備和存儲介質(zhì),實現(xiàn)降低柔性機器人的動力學(xué)模型的不確定性或外部擾動對控制系統(tǒng)的影響,提高柔性機器人的末端控制精度的目的。
為了實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案實現(xiàn):
一種柔性機器人末端抵達控制方法,包括:
步驟S1、建立柔性機器人的動力學(xué)模型;
步驟S2、根據(jù)所述動力學(xué)模型建立深度神經(jīng)網(wǎng)絡(luò),所述深度神經(jīng)網(wǎng)絡(luò)用于擬合所述動力學(xué)模型;
步驟S3、對所述深度神經(jīng)網(wǎng)絡(luò)進行第一次柔性機器人末端抵達過程的初步訓(xùn)練,得到所述深度神經(jīng)網(wǎng)絡(luò)的初始參數(shù);
步驟S4、對所述深度神經(jīng)網(wǎng)絡(luò)進行第二次柔性機器人抵達過程的初步訓(xùn)練,得到所述深度神經(jīng)網(wǎng)絡(luò)的最終參數(shù)。
優(yōu)選地,所述步驟S1包括:
將所述柔性機器人視為以弧坐標為自變量的連續(xù)模型,所述柔性機器人的空間位姿可以看作橫截面繞中心線的轉(zhuǎn)動或移動;
建立基于Cosserat桿模型的所述柔性機器人的動力學(xué)模型;
所述動力學(xué)模型采用如下公式進行表示:
式中,F(xiàn)為截面上內(nèi)力;M為截面上的主矩;f為柔性機器人的單節(jié)桿上均勻分布力;m為柔性機器人的單節(jié)桿上均勻力矩;J=J(s,t)是單位長度桿的慣量張量;ρ為柔性機器人單位長度桿的密度;S為柔性機器人單位長度桿的截面面積;Ω為截面主軸坐標系P-xyz中P點在慣性坐標系中關(guān)于時間變量t的角速度。
優(yōu)選地,所述步驟S2包括:采用實驗室外部標定測量相機實時采集所述柔性機器人末端抵達過程的隨機軌跡數(shù)據(jù);
根據(jù)所述動力學(xué)模型將所述隨機軌跡數(shù)據(jù)轉(zhuǎn)化為訓(xùn)練數(shù)據(jù),得到隨機軌跡數(shù)據(jù)集Drand=(s1,a1,r1,s2,a2,r2,...sT,aT,rT);其中,st表示當(dāng)前時刻為t時的所述柔性機器人的狀態(tài);at表示當(dāng)前時刻為t時的所述柔性機器人的動作;rt表示當(dāng)前時刻為t時的預(yù)測環(huán)境的獎勵;t=1,2,...,T;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海航天控制技術(shù)研究所,未經(jīng)上海航天控制技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010635603.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





