[發明專利]基于全局在線啟發式動態規劃永磁同步電機矢量控制方法有效
| 申請號: | 201810071519.7 | 申請日: | 2018-01-24 |
| 公開(公告)號: | CN108155836B | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 余海濤;王琦 | 申請(專利權)人: | 東南大學 |
| 主分類號: | H02P21/00 | 分類號: | H02P21/00;H02P21/18;H02P21/22;H02P6/10 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 211100 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 全局 在線 啟發式 動態 規劃 永磁 同步電機 矢量 控制 方法 | ||
1.一種基于全局在線啟發式動態規劃永磁同步電機矢量控制方法,其特征在于,該方法包括以下步驟:
步驟1:初始化單神經元全局在線啟發式動態規劃算法的目標網絡學習率、評價網絡學習率、單神經元PI算法參數,根據系統的跟蹤誤差,按照下式設計外部強化學習信號r(t):
r(t)=0.98*e(t)+0.02*e(t-1),e(t)=ω*(t)-ω(t)
其中,t表示當前時刻,t-1表示上一時刻,ω*(t)為目標轉速,ω(t)為實際轉速,e(t)為當前時刻轉速差,e(t-1)為上一時刻轉速差;
步驟2:通過神經網絡正向傳輸,計算評價網絡的輸出和目標網絡的輸出,所述評價網絡的輸出為性能指標函數J(t),所述目標網絡的輸出為內部強化學習信號S(t),其中t表示當前時刻;
步驟3:計算目標網絡誤差和評價網絡誤差,通過計算出的誤差分別對目標網絡和評價網絡的權值進行在線調整;
步驟4:通過求解最優性能指標函數,得到單神經元PI算法K值,通過得到的K值調節單神經元PI控制算法的輸出,即永磁同步電機系統q軸電流的參考值iq*;求解最優性能指標函數的方法如下:
其中,
K(t)=K(t-1)+ΔK(t)
其中,la(t)為當前時刻t的單神經元PI折扣因子學習率,ea(t)為當前時刻t的單神經元PI折扣因子學習反傳誤差,Ea(t)為當前時刻t的單神經元PI折扣因子學習反傳誤差的平方,ΔK(t)為當前時刻t的K值增量,Δu(t)為當前時刻t的控制信號的增量,u(t)為當前時刻t的控制信號,為當前時刻t的目標網絡輸入層到隱層權值矩陣第i行,第3列元素,為當前時刻t的評價網絡輸入層到隱層權值矩陣第l行,第4列元素,為當前時刻t的評價網絡輸入層到隱層權值矩陣第l行,第1列元素,為目標網絡的激活函數,qi(t)為當前時刻t的目標網絡隱層輸出向量的第i個元素,為評價網絡的激活函數,zl(t)為當前時刻t的目標網絡隱層輸出向量的第l個元素,J(t)為當前時刻t的性能指標,為當前時刻t的目標網絡隱層到輸出層權值矩陣第i個元素,為當前時刻t的評價網絡隱層到輸出層的權值矩陣第l個元素,S(t)為當前時刻t的內部強化學習信號,K(t-1)為上一時刻單神經元PI算法K值,K(t)為當前時刻t的K值;
步驟5:矢量控制系統中的d軸電流內環采用改變趨近率的滑模變結構控制器,通過d軸給定參考值id*=0和實際電流id的差,來調節d軸電壓ud;
矢量控制系統中的q軸電流內環采用改變趨近率的滑模變結構控制器,通過步驟4得到的q軸電流的參考值iq*和實際電流iq的差,來調節q軸電壓uq。
2.根據權利要求1所述的基于全局在線啟發式動態規劃永磁同步電機矢量控制方法,其特征在于,所述步驟2中的性能指標函數為:
其中,為評價網絡激活函數,為當前時刻評價網絡輸入向量,ck(t)為當前時刻t的評價網絡輸入向量中的第k個元素,k的取值范圍為1到5,t-1為上一時刻,l為評價網絡隱層節點序號,l取值范圍為1到Nc,Nc為評價網絡隱層節點數,Nf為目標網絡隱層節點數,為當前時刻t的評價網絡輸入層到隱層權值矩陣第l行,第k列元素,zl(t)為當前時刻t的評價網絡隱層輸出向量的第l個元素,為當前時刻t的評價網絡隱層到輸出層的權值矩陣第l個元素,J(t)為當前時刻t的性能指標函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810071519.7/1.html,轉載請聲明來源鉆瓜專利網。





