[發(fā)明專利]一種基于確定學(xué)習(xí)的輪式移動(dòng)機(jī)器人事件觸發(fā)跟蹤控制方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010830331.3 | 申請(qǐng)日: | 2020-08-18 |
| 公開(公告)號(hào): | CN112051734B | 公開(公告)日: | 2021-07-23 |
| 發(fā)明(設(shè)計(jì))人: | 占宏;胡銳;黃龍旺 | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G05B13/04 | 分類號(hào): | G05B13/04 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 確定 學(xué)習(xí) 輪式 移動(dòng) 機(jī)器人 事件 觸發(fā) 跟蹤 控制 方法 | ||
本發(fā)明公開了一種基于確定學(xué)習(xí)的輪式移動(dòng)機(jī)器人事件觸發(fā)跟蹤控制方法,具體包括以下步驟:建立輪式移動(dòng)機(jī)器人的動(dòng)力學(xué)模型和期望的周期軌跡;設(shè)計(jì)自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,并利用確定學(xué)習(xí)理論獲取經(jīng)驗(yàn)知識(shí);設(shè)計(jì)作用于傳感器與控制器之間網(wǎng)絡(luò)通道的事件觸發(fā)機(jī)制;建立基于經(jīng)驗(yàn)知識(shí)和事件觸發(fā)的常值神經(jīng)網(wǎng)絡(luò)控制器。本發(fā)明設(shè)計(jì)的方法不僅將傳統(tǒng)的輪式移動(dòng)機(jī)器人時(shí)間觸發(fā)控制方式推廣到了事件觸發(fā)控制方式,降低了遠(yuǎn)程控制中網(wǎng)絡(luò)帶寬的占用,而且利用確定學(xué)習(xí)理論設(shè)計(jì)了常值神經(jīng)網(wǎng)絡(luò)控制器,在減少網(wǎng)絡(luò)帶寬的同時(shí)保證了好的暫態(tài)跟蹤性能。
技術(shù)領(lǐng)域
本發(fā)明涉及輪式移動(dòng)機(jī)器人的智能跟蹤控制的技術(shù)領(lǐng)域,具體涉及一種基于確定學(xué)習(xí)的輪式移動(dòng)機(jī)器人事件觸發(fā)跟蹤控制方法。
背景技術(shù)
輪式移動(dòng)機(jī)器人是結(jié)合了信息論、控制論、人工智能等多個(gè)不同領(lǐng)域的產(chǎn)物,其在工業(yè)生產(chǎn)、土木建筑、醫(yī)療衛(wèi)生、教育科研等諸多場(chǎng)景中得到廣泛地應(yīng)用。注意到輪式移動(dòng)機(jī)器人系統(tǒng)由于阻尼和摩擦力等因素導(dǎo)致系統(tǒng)存在建模不確定性。為了克服建模不確定性帶來的控制精度下降問題,通常采用神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)輪式移動(dòng)機(jī)器人系統(tǒng)未知?jiǎng)討B(tài)進(jìn)行辨識(shí)。但是傳統(tǒng)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制對(duì)機(jī)器人執(zhí)行相同或相似控制任務(wù)都需要在線調(diào)整權(quán)值來重新辨識(shí)未知?jiǎng)討B(tài),使得控制方案耗時(shí)長(zhǎng),不易實(shí)施。基于確定學(xué)習(xí)設(shè)計(jì)出的控制器能夠利用學(xué)習(xí)到的經(jīng)驗(yàn)知識(shí)來完成控制任務(wù),避免了神經(jīng)網(wǎng)絡(luò)重復(fù)訓(xùn)練的問題。然而,現(xiàn)有的確定學(xué)習(xí)控制方案均采用了時(shí)間觸發(fā)方式。由于其通過固定時(shí)間周期地對(duì)信號(hào)進(jìn)行采樣傳輸,勢(shì)必會(huì)造成不必要的信號(hào)傳輸,從而造成網(wǎng)絡(luò)通道不必要的資源占用。因此,設(shè)計(jì)一個(gè)適當(dāng)?shù)挠|發(fā)機(jī)制,使得控制系統(tǒng)既能保持良好的控制性能也能減少網(wǎng)絡(luò)通道資源的使用,是網(wǎng)絡(luò)化控制系統(tǒng)中的一個(gè)非常重要的課題。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)上述現(xiàn)有技術(shù)的不足,提出了一種基于確定學(xué)習(xí)和事件觸發(fā)的輪式移動(dòng)機(jī)器人的位置控制方法;針對(duì)神經(jīng)網(wǎng)絡(luò)每次做任務(wù)都要重復(fù)訓(xùn)練的問題,該方法利用確定學(xué)習(xí)理論,將收斂后的神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)為經(jīng)驗(yàn)知識(shí),當(dāng)移動(dòng)機(jī)器人再次做同樣任務(wù)的時(shí)候,可以直接調(diào)用經(jīng)驗(yàn)知識(shí)進(jìn)行利用,而不需要重復(fù)訓(xùn)練神經(jīng)網(wǎng)絡(luò);針對(duì)傳統(tǒng)時(shí)間觸發(fā)控制方法出現(xiàn)的不必要的網(wǎng)絡(luò)資源傳輸問題,該方法利用事件觸發(fā)機(jī)制,當(dāng)不滿足所設(shè)事件觸發(fā)條件的時(shí)候,才進(jìn)行信號(hào)的傳輸,從而避免了網(wǎng)絡(luò)資源浪費(fèi)的問題。
本發(fā)明的目的可以通過如下技術(shù)方案實(shí)現(xiàn):
本發(fā)明提供一種基于確定學(xué)習(xí)的輪式移動(dòng)機(jī)器人事件觸發(fā)跟蹤控制方法,包括以下步驟:
步驟1、建立輪式移動(dòng)機(jī)器人的動(dòng)力學(xué)模型和期望的周期軌跡;
步驟2、獲取經(jīng)驗(yàn)知識(shí):結(jié)合李雅普諾夫穩(wěn)定性理論和動(dòng)態(tài)面設(shè)計(jì)方法構(gòu)造自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,并利用確定學(xué)習(xí)理論將收斂后的神經(jīng)網(wǎng)絡(luò)權(quán)值保存為常值權(quán)值
步驟3、構(gòu)建作用于傳感器到控制器之間網(wǎng)絡(luò)通道的事件觸發(fā)機(jī)制,當(dāng)網(wǎng)絡(luò)通道傳輸信號(hào)達(dá)到觸發(fā)條件,將采用信號(hào)經(jīng)過網(wǎng)絡(luò)通道傳輸?shù)娇刂贫耍?/p>
步驟4、設(shè)計(jì)基于經(jīng)驗(yàn)知識(shí)和事件觸發(fā)的常值神經(jīng)網(wǎng)絡(luò)控制器,利用常值神經(jīng)網(wǎng)絡(luò)控制器對(duì)觸發(fā)事件進(jìn)行跟蹤;所述常值神經(jīng)網(wǎng)絡(luò)控制器為:
其中,B表示與移動(dòng)機(jī)器人的質(zhì)量、慣性、輪子半徑相關(guān)的已知常數(shù)矩陣,k2為誤差的設(shè)計(jì)參數(shù),為經(jīng)過確定學(xué)習(xí)得到的常值神經(jīng)網(wǎng)絡(luò)權(quán)值。
進(jìn)一步的,步驟1中,所述動(dòng)力學(xué)模型為:
其中x1=[x,y,θ]T為環(huán)境坐標(biāo)系下的移動(dòng)機(jī)器人的位姿向量,表示機(jī)器人坐標(biāo)系下的移動(dòng)機(jī)器人的速度向量,J(x1)表示用于坐標(biāo)變化的旋轉(zhuǎn)矩陣,B是一個(gè)已知的且與移動(dòng)機(jī)器人的質(zhì)量、慣性、輪子半徑有關(guān)的常數(shù)矩陣,A(x2)是未知的且與移動(dòng)機(jī)器人的摩擦系數(shù)、慣性、質(zhì)量有關(guān)的矩陣;τ是系統(tǒng)的控制輸入。
進(jìn)一步的,步驟1中,所述期望的周期軌跡為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010830331.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





