[發明專利]基于控制策略更新時間預測的優化控制系統與方法在審
| 申請號: | 202211091378.8 | 申請日: | 2022-09-07 |
| 公開(公告)號: | CN116382070A | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 趙博;袁郭玲;林銘鐸;夏宏兵 | 申請(專利權)人: | 北京師范大學 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04 |
| 代理公司: | 昆明合眾智信知識產權事務所 53113 | 代理人: | 湯文旋 |
| 地址: | 100875 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 控制 策略 更新 時間 預測 優化 控制系統 方法 | ||
本發明提供一種基于控制策略更新時間預測的優化控制系統與方法,包括構建非線性系統的動力學模型和代價函數、獲取非線性系統的非線性李雅普諾夫函數和哈密頓函數,得到最優代價函數及哈密頓—雅可比—貝爾曼方程,確定最優神經控制策略的閉環形式、構建一個權重向量協同更新的評判神經網絡,來估計最優代價函數、設計自觸發條件,使用前一個觸發時刻和對應的狀態預測下一個觸發時刻、求解哈密頓—雅可比—貝爾曼方程,間接地獲得最優神經控制策略,并在預測的觸發時刻進行更新和將獲得的最優控制策略應用于系統。本發明采用ADP的方法,并設計自觸發條件,從而獲得無需持續監測系統狀態的最優控制系統與方法,減少了計算量,節省了通信帶寬和能量消耗。
技術領域
本發明涉及自動控制系統領域,具體為一種基于控制策略更新時間預測的優化控制系統與方法。
背景技術
隨著自動控制系統在理論研究和實際應用中的不斷發展,目前絕大多數的控制方式都是基于數字平臺實現的,需要依賴傳感器進行數據的采集和處理,將各種模擬信號轉化為數字信號,然后傳遞給下一個處理單元進行計算、處理等操作,所以該過程中需要傳感器連續不斷地進行數據采樣,以求保證盡可能的還原信號的本來面目。傳感器采樣雖然是連續不斷的過程,但最終得到的數據仍然是離散的,因此需要將該離散的數據通過零階保持器變為連續信號,在傳統的控制方式中這一過程是周期進行的,也被稱作時間觸發機制。
盡管這種采樣方式有很多的優點且更易于設計,但近年來由于通信技術的不斷發展,其缺點卻越來越凸顯。由于周期采樣的特性,在一個控制系統中需要連續不斷的對系統狀態進行采樣,這給現代大型或復雜的控制系統帶來的計算資源消耗不可想象。例如,在許多現代控制系統中廣泛使用的網絡化傳輸,系統狀態一般被采樣后通過有線或無線方式傳輸到遠端,在此過程中如果網絡通信帶寬是有限的,那么采用時間觸發機制可能會造成網絡擁堵和網絡資源的浪費,進而會導致系統資源浪費。與時間觸發控制不同,事件觸發控制方法具有非周期性的采樣特性,只有當系統狀態的偏差量超過某個觸發條件限定的閾值,才會進行傳感器采樣和控制器運算,這大大減少了控制器、傳感器和執行器之間的數據傳輸,從而降低了計算負擔,節約了通信帶寬和能耗。雖然事件觸發控制明顯優于周期性控制,但觸發條件需要硬件設備對系統狀態進行持續監控。當系統結構的規模和復雜性不斷增加時,資源和能源也會相應增加。因此,為了保證系統的穩定性和控制性能,開發一種同時提供滿意的控制性能水平,無需持續監測狀態的硬件設備,還能降低資源和能源消耗的控制系統與方法非常迫切。
針對不同場景下的非線性系統,研究人員正在努力研究相應的最優控制方法以實現足夠的控制水平。動態規劃方法被認為是尋求最優控制的經典而有效的工具,自適應動態規劃(Adaptive?dynamic?programming,ADP)作為解決傳統動態規劃算法常面臨的“維數災”的有效方法,其主要思想是借助函數估計器(如神經網絡和模糊邏輯等)結合動態規劃、強化學習等技術近似求解哈密頓—雅可比—貝爾曼方程,進而得到最優控制系統。
對于不同類型的系統,研究人員結合事件觸發和自觸發機制進行了一些有益的嘗試。為了避免使用硬件設備對系統狀態進行持續檢測,一些研究者在設計控制器時引入了自觸發機制,但是現有的ADP控制方法的計算負擔大、通信頻率和能耗高,為了避免在現有的事件觸發控制策略中使用硬件設備進行持續監測,降低計算負擔、通信帶寬和能耗,開發一種基于控制策略更新時間預測的優化控制系統與方法是十分必要的。
發明內容
本發明的目的在于提供一種基于控制策略更新時間預測的優化控制系統與方法,針對現有ADP控制方法計算負擔大、通信頻率和能耗高等問題,發明一種基于控制策略更新時間預測的優化控制系統與方法。該方法構建了一個帶有權重向量協同更新的評判神經網絡,保證權重誤差動態的漸近穩定性,估計非線性系統的最優代價函數,進而求解哈密頓-雅可比-貝爾曼方程,間接地獲得最優神經控制策略,同時,設計了一個合適的自觸發條件以預測下一個控制信號更新時刻,進而避免在事件觸發控制方法中使用硬件設備對系統狀態進行持續監測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京師范大學,未經北京師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211091378.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于雞蛋印制二維碼的打印機
- 下一篇:一種電力系統架線裝置





