[發明專利]一種控制永磁同步直線電機的方法及系統在審
| 申請號: | 201910399548.0 | 申請日: | 2019-05-14 |
| 公開(公告)號: | CN110323981A | 公開(公告)日: | 2019-10-11 |
| 發明(設計)人: | 張振宇;張昱;陳麗;林利彬;張東波;秦昊;凌翔;劉智;楊瑞;魏千洲;王曉旭 | 申請(專利權)人: | 廣東省智能制造研究所 |
| 主分類號: | H02P21/00 | 分類號: | H02P21/00;H02P25/064;G05B11/42 |
| 代理公司: | 廣州容大專利代理事務所(普通合伙) 44326 | 代理人: | 劉新年 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 永磁同步直線電機 強化學習算法 永磁直線電機 自適應控制 存儲介質 高速穩定 控制系統 強化學習 數學模型 伺服控制 伺服系統 推力波動 性能品質 準確控制 控制器 并行性 魯棒性 速度環 自適應 自學習 確定性 代理 環節 應用 | ||
1.一種控制永磁同步直線電機的方法,其特征在于,所述的方法具體包括如下步驟:
建立永磁直線電機數學模型;
通過深度確定性策略梯度方法對永磁同步直線電機的速度環進行自適應控制;
獲得最優的強化學習代理,實現PID伺服系統的參數的自動調整。
2.根據權利要求1所述的一種控制永磁同步直線電機的方法,其特征在于,于步驟通過深度確定性策略梯度方法對永磁同步直線電機的速度環進行自適應控制中,還包括如下步驟:
通過actor-critic網絡構建強化學習代理的框架;
以PID速度伺服系統為環境對象,獲取激勵函數的跟蹤誤差曲線;
實現PID參數自動調整;
具體地,PID控制器由以下方程設計:
其中,u(t)表示控制器t時刻輸出信號,u(t-1)表示控制器t-1時刻輸出信號,Δu(t)表示控制器輸出增量,ki,kp,kd分別表示比例、積分、微分系數,e(t)表示給定值與實際輸出反饋值之差,e(t-1)表示上一時刻給定值與實際輸出反饋值之差,e(t-2)表示上上時刻給定值與實際輸出反饋值之差,Δe(t)表示當前時刻誤差與上一時刻誤差之差,Δe(t-1)表示上一時刻誤差與上上時刻誤差之差,Δ2e(t)=Δe(t)-Δe(t-1)。
3.根據權利要求2所述的一種控制永磁同步直線電機的方法,其特征在于,于步驟通過actor-critic網絡構建強化學習代理的框架中;
critic的動作值函數具體為:
Q(st,μ(st|θμ)|θQ) (2)
actor的動作值函數具體為:
μ(st|θμ) (3)
其中,θQ和θμ分別表示critic在線網絡和actor在線網絡的權重,st表示存儲當前狀態,μ表示actor在線網絡策略,Q表示critic在線網絡對μ策略的評估。
4.根據權利要求2所述的一種控制永磁同步直線電機的方法,其特征在于,于步驟通過actor-critic網絡構建強化學習代理的框架中;
actor評估網絡選擇動作采用的函數為:
at=[kp,ki,kd]=μ(st|θμ)+Noise (4)
其中,at代表t時刻代理執行的動作即t時刻ki,kp,kd的值,ki,kp,kd分別表示比例、積分、微分系數,μ表示actor在線網絡策略,st表示存儲當前狀態,θμ代表actor在線網絡的權重,Noise代表隨機OU噪聲。
5.根據權利要求1所述的一種控制永磁同步直線電機的方法,其特征在于,于步驟通過深度確定性策略梯度方法對永磁同步直線電機的速度環進行自適應控制中,還包括如下步驟:
從存儲器中取出部分隨機樣本,進而進行訓練更新目標網絡;
具體的學習過程函數為:
其中,yi代表目標網絡,ri代表在i學習過程中的回報值,si+1代表i+1時刻存儲狀態,分別代表目標權重,γ代表折扣因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東省智能制造研究所,未經廣東省智能制造研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910399548.0/1.html,轉載請聲明來源鉆瓜專利網。





