[發明專利]基于強化學習的關節模組不等式約束最優魯棒控制方法有效
| 申請號: | 202110990167.7 | 申請日: | 2021-08-26 |
| 公開(公告)號: | CN113703319B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 甄圣超;王君;劉曉黎 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04;G06N3/092;G06N3/048;G06N3/082;G06N3/06;G06N3/006 |
| 代理公司: | 合肥金安專利事務所(普通合伙企業) 34114 | 代理人: | 吳娜 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 強化 學習 關節 模組 不等式 約束 最優 魯棒控制 方法 | ||
1.一種基于強化學習的關節模組不等式約束最優魯棒控制方法,其特征在于:該方法包括下列順序的步驟:
(1)首先在仿真平臺上搭建具備神經網絡訓練能力的關節模組虛擬仿真環境,構建具備Dropout隨機失活神經元方法的強化學習神經網絡模型;
(2)初始化關節模組虛擬仿真環境;
(3)采用改進的粒子群優化算法調整強化學習神經網絡模型中多層神經元之間的連接權值,實現面向關節模組軌跡跟蹤控制的強化學習神經網絡的自適應學習;
(4)隨機失活強化學習神經網絡模型的一部分神經元,將預先設定的干擾參數輸入到每個關節模組虛擬仿真環境中,控制強化學習神經網絡結合每個關節模組虛擬仿真環境,輸出關節模組的控制參數信息;
(5)判斷關節模組虛擬仿真環境訓練終止條件,收集當前關節模組虛擬仿真環境下的訓練數據集;
(6)將強化學習神經網絡訓練得到的最優參數輸入到不等式約束最優魯棒控制器內,首先通過模糊方法來消除電機的非線性和不確定性,再通過不等式約束將電機運行軌跡限制在一個指定的范圍內并顯著提高其控制精度。
2.根據權利要求1所述的基于強化學習的關節模組不等式約束最優魯棒控制方法,其特征在于:在步驟(1)中,所述強化學習神經網絡為全連接網絡,包括兩個隱含層和一個池化層,每層包含256個節點,激活函數選擇Relu函數,且通過Dropout隨機失活神經元方法來防止過擬合現象。
3.根據權利要求1所述的基于強化學習的關節模組不等式約束最優魯棒控制方法,其特征在于:所述步驟(2)初始化關節模組虛擬仿真環境包括初始化關節模組所在的仿真環境、初始化電機初始位置和負載重量以及擾動項。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110990167.7/1.html,轉載請聲明來源鉆瓜專利網。





