[發(fā)明專利]一種基于深度學(xué)習(xí)的機(jī)器人動(dòng)力學(xué)建模方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810408136.4 | 申請(qǐng)日: | 2018-04-28 |
| 公開(公告)號(hào): | CN108621159B | 公開(公告)日: | 2020-05-19 |
| 發(fā)明(設(shè)計(jì))人: | 邵振洲;孫鵬飛;渠瀛;關(guān)永;施智平;王曉東 | 申請(qǐng)(專利權(quán))人: | 首都師范大學(xué) |
| 主分類號(hào): | B25J9/16 | 分類號(hào): | B25J9/16 |
| 代理公司: | 北京永創(chuàng)新實(shí)專利事務(wù)所 11121 | 代理人: | 冀學(xué)軍 |
| 地址: | 100048 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 機(jī)器人 動(dòng)力學(xué) 建模 方法 | ||
本發(fā)明公開了一種基于深度學(xué)習(xí)的機(jī)器人動(dòng)力學(xué)建模方法,屬于智能機(jī)器人領(lǐng)域,收集數(shù)據(jù)劃分為訓(xùn)練集和數(shù)據(jù)集,構(gòu)建動(dòng)力學(xué)模型搭建RNN循環(huán)神經(jīng)網(wǎng)絡(luò);按時(shí)間步劃分訓(xùn)練集輸入到輸入隱藏層,轉(zhuǎn)化為三維數(shù)據(jù)到達(dá)GRU cell層,把當(dāng)前輸入的信息與之前的信息相結(jié)合,計(jì)算前一時(shí)刻的狀態(tài)信息參與到新生成的狀態(tài)的比例;然后將計(jì)算得到的當(dāng)前的候選狀態(tài)和前一個(gè)時(shí)間步時(shí)刻的信息通過更新門選擇,得到當(dāng)前時(shí)刻的隱藏層狀態(tài),傳遞到下一時(shí)間步,輸出到輸出隱藏層,得到預(yù)測(cè)值小于等于誤差閾值采集的真實(shí)結(jié)果,為最優(yōu)值。最后利用數(shù)據(jù)集對(duì)GRU門控循環(huán)單元網(wǎng)絡(luò)進(jìn)行檢測(cè)。本發(fā)明提高扭矩預(yù)測(cè)的精度,大大減小輸入信號(hào)的訓(xùn)練時(shí)間,減小了傳統(tǒng)反向傳播的梯度誤差。
技術(shù)領(lǐng)域
本發(fā)明屬于智能機(jī)器人領(lǐng)域,具體是一種基于深度學(xué)習(xí)的機(jī)器人動(dòng)力學(xué)建模方法。
背景技術(shù)
機(jī)器人動(dòng)力學(xué)模型的重要應(yīng)用是控制機(jī)器人,通過動(dòng)力學(xué)方程可以準(zhǔn)確地計(jì)算出機(jī)器人運(yùn)動(dòng)需要的力矩;但是,由于擾動(dòng)、彈性、非線性摩擦以及負(fù)載變化等因素的影響,很多動(dòng)力學(xué)模型的參數(shù)難以被確定,傳統(tǒng)的動(dòng)力學(xué)方法(如拉格朗日、牛頓歐拉、凱恩)很難對(duì)機(jī)器人進(jìn)行精準(zhǔn)的動(dòng)力學(xué)建模,無(wú)法滿足精準(zhǔn)的實(shí)際應(yīng)用。
近些年來(lái),深度學(xué)習(xí)的發(fā)展使得這一問題的解決迎來(lái)了轉(zhuǎn)機(jī);神經(jīng)網(wǎng)絡(luò)具有極強(qiáng)的非線性映射能力,通過訓(xùn)練一定數(shù)量的數(shù)據(jù),使得在建模的過程中不用人為的考慮不確定性因素的影響,可以很好提高機(jī)器人動(dòng)力學(xué)模型的預(yù)測(cè)精度。
目前應(yīng)用的ESN(Echo State Network,回聲狀態(tài)網(wǎng)絡(luò))機(jī)器學(xué)習(xí)算法已經(jīng)應(yīng)用于推斷機(jī)器人的結(jié)構(gòu)和環(huán)境特征,模擬復(fù)雜的機(jī)器人系統(tǒng);該算法包括兩個(gè)隱藏層:自組織層和遞歸層,它是一個(gè)實(shí)時(shí)的機(jī)器人模型學(xué)習(xí)算法,能夠很好的適應(yīng)環(huán)境的變化。但是,該ESN機(jī)器學(xué)習(xí)算法沒有充分考慮輸入信號(hào)的特性,通常忽略輸出反饋連接。因此,ESN的回波狀態(tài)特性在一定時(shí)間內(nèi)不能完全滿足,不能提供更高的精度和更快的收斂速度進(jìn)行時(shí)間序列預(yù)測(cè)。
基于動(dòng)力學(xué)模型的機(jī)器人運(yùn)動(dòng)控制需要對(duì)機(jī)器人各關(guān)節(jié)扭矩實(shí)時(shí)精確預(yù)測(cè),對(duì)于實(shí)現(xiàn)機(jī)器人功能完美性和安全性是必要的;機(jī)器人動(dòng)力學(xué)模型是變化的,由于輸入信號(hào)的不斷變化和機(jī)器人系統(tǒng)的非線性摩擦、負(fù)載變化等因素的影響,實(shí)際預(yù)測(cè)的扭矩可能和真正的運(yùn)動(dòng)扭矩有一些差別,這時(shí)需要我們對(duì)建好的動(dòng)力學(xué)模型進(jìn)行實(shí)時(shí)更新,以減小誤差,提升精度。
發(fā)明內(nèi)容
本發(fā)明為了在實(shí)時(shí)學(xué)習(xí)過程中,提高扭矩預(yù)測(cè)的精度,精確地模擬復(fù)雜的機(jī)器人系統(tǒng);提出了一種基于深度學(xué)習(xí)的機(jī)器人動(dòng)力學(xué)建模方法。
具體步驟如下:
步驟一、針對(duì)某機(jī)器人,收集該機(jī)器人的關(guān)節(jié)位置,關(guān)節(jié)速度,關(guān)節(jié)加速度以及對(duì)應(yīng)的扭矩?cái)?shù)據(jù),并劃分為訓(xùn)練集和數(shù)據(jù)集;
步驟二、構(gòu)建針對(duì)機(jī)器人的關(guān)節(jié)位置,關(guān)節(jié)速度和關(guān)節(jié)加速度的動(dòng)力學(xué)模型T;
矢量q表示關(guān)節(jié)位置;表示關(guān)節(jié)速度;表示關(guān)節(jié)加速度;
T表示要學(xué)習(xí)的扭矩,代表著控制關(guān)節(jié)運(yùn)動(dòng)的力(矢量)進(jìn)而控制機(jī)械臂的運(yùn)動(dòng)趨勢(shì);M(q)表示慣性矩陣,表示結(jié)合了科氏力、向心力、摩擦力和重力的作用;表達(dá)式為:表示科氏力,表示摩擦力;g(q)表示重力。
為模擬函數(shù),模擬其他擾動(dòng)、彈性、非線性摩擦或負(fù)載變化等因素;如:機(jī)械設(shè)計(jì)中的彈性、質(zhì)量或惰性的模型參數(shù)誤差、振動(dòng)效應(yīng)、摩擦、耦合和傳感器噪音。
步驟三、根據(jù)動(dòng)力學(xué)模型τ設(shè)置輸入向量x的目標(biāo)學(xué)習(xí)函數(shù)y;
y=f(x);y=τ,x為輸入的矢量值,包括機(jī)器人的關(guān)節(jié)位置,關(guān)節(jié)速度和關(guān)節(jié)加速度。
步驟四、搭建包括輸入隱藏層,GRU cell層和輸出隱藏層的RNN循環(huán)神經(jīng)網(wǎng)絡(luò),用于對(duì)目標(biāo)學(xué)習(xí)函數(shù)y進(jìn)行優(yōu)化;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于首都師范大學(xué),未經(jīng)首都師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810408136.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





