[發明專利]基于自適應神經網絡的機器人模型預測控制方法有效
| 申請號: | 202010698815.7 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111618864B | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 康二龍;高潔;喬紅 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 北京市恒有知識產權代理事務所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自適應 神經網絡 機器人 模型 預測 控制 方法 | ||
1.一種基于自適應神經網絡的機器人模型預測控制方法,其特征在于,該方法包括:
步驟S10,獲取機械臂tk時刻的實際位置、實際速度以及期望位置、期望速度,計算跟蹤誤差;并初始化i為0、nR為1;其中,i、nR為自然數;
步驟S20,對預構建的動作-評價網絡中的動作網絡,基于tk+i時刻的跟蹤誤差,結合其tk+i-1時刻的權重值,通過其獲取tk+i-tk+i+1時刻的控制率,作為預測控制率,并更新動作-評價網絡的權重值;
步驟S30,判斷i是否大于設定的預測時長,若是,則執行步驟S40,否則基于所述預測控制率,結合tk+i時刻的跟蹤誤差,通過預構建的預測模型獲取tk+i+1時刻的跟蹤誤差,并令i=i+1,跳轉步驟S20;
步驟S40,判斷動作網絡、評價網絡權重變化的和是否小于等于設定閾值或者nR是否 大于設定的最大迭代次數,若是,則執行步驟S50,否則令nR=nR+1,i=0,跳轉步驟S20;所述權重變化為更新后的權重值與更新前的權重值的差;
步驟S50,基于更新的權重值,結合tk時刻的位置誤差,通過所述動作網絡計算機械臂tk-tk+1時刻的實際控制率,作用于機械臂;
步驟S60,令k=k+1,循環執行步驟S10-步驟S50,直至機械臂到達設定的目標位置;
所述預測模型、所述動作-評價網絡基于徑向基神經網絡構建。
2.根據權利要求1所述的基于自適應神經網絡的機器人模型預測控制方法,其特征在于,所述預測模型為基于機械臂的跟蹤誤差的動態特性構建的模型,該模型其獲取跟蹤誤差的方法為:
其中,表示tk時刻的一階跟蹤誤差、二階跟蹤誤差,表示tk+1時刻的一階跟蹤誤差動態、二階跟蹤誤差動態,表示預測模型的激活函數,qd表示期望軌跡,L表示正整數,表示預測模型的權重值,表示tk時刻的跟蹤誤差的估計偏差,τ表示預測控制率,z+表示增廣誤差,表示tk時刻的左側逼近,K1表示預設的虛擬變量參數。
3.根據權利要求2所述的基于自適應神經網絡的機器人模型預測控制方法,其特征在于,所述動作網絡其獲取控制率的方法為:
其中,表示當前時刻的控制率,t表示時間段,表示哈密爾頓函數,表示跟蹤誤差,表示哈密爾頓函數中控制率的參數項,表示動作網絡的權重值,表示動作網絡的激活函數,λ表示輸入約束上限值,R表示損失函數參數,表示預測模型參數,(·)T表示轉置。
4.根據權利要求3所述的基于自適應神經網絡的機器人模型預測控制方法,其特征在于,所述動作網絡其權重值更新方法為:
其中,表示動作網絡的更新變化率,αa>0表示動作網絡預設的學習率,Ξ2(·)定義為一種運算,分別對每個(·)中的元素求平方,sech表示雙曲正割函數,ka、kp表示動作網絡預設的學習參數,表示評價網絡的權重值。
5.根據權利要求4所述的基于自適應神經網絡的機器人模型預測控制方法,其特征在于,所述評價網絡其計算最優損失的方法為:
其中,表示評價網絡的權重值,表示評價網絡獲取的最優損失值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010698815.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種低電壓發熱油墨及其制備方法
- 下一篇:一種鋼珠鑄造模具





