[發明專利]一種基于經驗控制的多參數機器人實時行為校正方法有效
| 申請號: | 201811063090.3 | 申請日: | 2018-09-12 |
| 公開(公告)號: | CN109249393B | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 毛新軍;黃裕泓;楊碩;劉哲 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 湖南兆弘專利事務所(普通合伙) 43008 | 代理人: | 周長清 |
| 地址: | 410073 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 經驗 控制 參數 機器人 實時 行為 校正 方法 | ||
1.一種基于經驗控制的多參數機器人實時行為校正方法,其特征在于,包括:
基于迭代仿真采集的多組狀態信息,通過離線學習的方式生成機器人的參數化控制函數;所述狀態信息是連接離線學習控制函數與實時機器人行為調整兩個主要部分的橋梁;所述狀態信息通過實際任務行為和預期任務行為之間的差異來表示;結合控制參數和偏差,狀態信息表示為公式(1)和公式(2)數據集中的向量:
P=[V AS]T (1)
X=[Dreal Daim V AC l]T (2)
其中公式(1)展示著控制器參數是由速度V和傾角的變化步長AS確定;在公式(2)中,定義了多個輸入;輸入包括兩種變量,即當前時刻的行為和過去時間的變量;路徑和機器人位置之間的偏差l是當前時刻的行為;在公式(2)中,機器人的實際方向Dreal,期望的方向Daim,速度V和來自控制器的實際轉角AC是前一時間的變量;它們是機器人的控制條件,會影響當前的行為l;
基于離線學習的參數化控制函數,構建機器人實時運行過程中的自適應調整模型,利用模型對機器人的偏差行為進行校正;
根據外部環境變化,自主地從多個控制參數中選擇最為敏感的參數控制機器人的行為更新選擇。
2.根據權利要求1所述的基于經驗控制的多參數機器人實時行為校正方法,其特征在于,采用離線學習的方式生成機器人的參數化控制函數,參數模型函數將由經驗數據離線生成;機器人以不同參數迭代運行,以收集機器人狀態信息作為數據集的經驗數據;借助經驗數據,將函數擬合應用于提取數據集中參數之間的潛在規則以及來自它們的影響,然后為每個參數創建模型函數。
3.根據權利要求1所述的基于經驗控制的多參數機器人實時行為校正方法,其特征在于,包括實時對機器人行為進行自適應調整,機器人的行為根據實時機器人狀態信息進行自適應調整;傳感器監視器使用傳感器收集狀態信息并確定如何更新機器人的參數;之后,機器人使用離線學習的參數模型函數來調整多個參數;如果機器人行為產生不可接受的偏差,機器人的行為將會改變否則將維持原有控制參數模型。
4.根據權利要求1所述的基于經驗控制的多參數機器人實時行為校正方法,其特征在于,包括進行多參數更新的過程,即一次選擇敏感參數進行更新,而其他參數保持不變;這個選擇將通過學習的參數化函數對控制參數的偏微分函數結合實時狀態信息進行。
5.根據權利要求1—4中任意一項所述的基于經驗控制的多參數機器人實時行為校正方法,其特征在于,還包括離線生成控制模型,具體包括以下步驟:
S1:控制函數模型建模;
S2:實現函數擬合的數學模型;
S3:離線學習生成控制模型算法。
6.根據權利要求5所述的基于經驗控制的多參數機器人實時行為校正方法,其特征在于,所述步驟S1中建模為下式(3):
在式(3)中,Dt-1=[Dreal Daim]T表示方向信息,XE表示公式(2)中輸入的拓展;由于希望在微分時顯示Dt-1和AC,所以該方程具有用于方向信息Dt-1的二階模型和用于AC的三角函數;由于有多個參數,控制器需要超過一個參數模型的功能,以便每個參數都有自己的規則生效。
7.根據權利要求1—4中任意一項所述的基于經驗控制的多參數機器人實時行為校正方法,其特征在于,包括實時更新多個控制參數,在機器人實時運行中,傳感器監視機器人的行為以生成具有偏差l的狀態信息,用于解釋機器人行為偏移;如果偏差l不可接受,機器人應該改變控制器參數,然后使用來自經驗的模型函數進行行為更新。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811063090.3/1.html,轉載請聲明來源鉆瓜專利網。





