[發明專利]用于借助于仿真模塊的計算機輔助的設施控制優化的方法在審

申請號：	201580035911.0	申請日：	2015-05-05
公開（公告）號：	CN106662847A	公開（公告）日：	2017-05-10
發明（設計）人：	S.迪爾;A.亨切爾;V.施特青格;S.烏德盧夫特;J.P.辛格	申請（專利權）人：	西門子公司
主分類號：	G05B13/04	分類號：	G05B13/04
代理公司：	中國專利代理(香港)有限公司72001	代理人：	盧江,劉春元
地址：	德國***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	用于借助于仿真模塊計算機輔助設施控制優化方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

在控制復雜的動態系統（諸如燃氣輪機、風力渦輪機或者其它的技術設施或者系統）時，一般來說值得期望的是：關于預先給定的標準來優化系統特性。這樣，例如在燃氣輪機的情況下，一般來說力求改進效率、效果和/或燃燒動力學，以及降低廢氣排放、燃燒室噪聲和/或磨損。

背景技術

復雜的動態系統通常具有多個相互作用的控制參數。因此，為了控制該動態系統，影響系統特性的多個可能的控制行動供系統控制裝置支配。在此，不同的控制行動可以以非常復雜的方式、尤其是也相反地相互作用。這樣，對第一控制標準有積極效果的控制行動可能對第二控制標準有消極作用。此外，相同的控制行動根據系統狀態而可能積極地或者消極地起作用。

從現有技術中已知計算機輔助的控制裝置或者調節器，所述控制裝置或者調節器特定地適用于遵循或者優化預先給定的控制標準。然而，這樣的控制標準一般來說根據動態系統的應用情況而有區別。這樣，例如可以針對不同的國家中的發電廠規定廢氣排放的不同的極限值。在第一國家中，低的廢氣排放相對于其它的控制標準可能優先，而在第二國家中，低的磨損和低的維護成本可能優先。一般來說，多個相互影響的控制標準應以適當的方式來權衡，以便針對當前的情況實現最優的控制。

為了優化預先給定的控制標準，流行的控制通常使用機器學習的技術。這樣，例如可以針對如下方面訓練神經網絡：關于一個或多個預先給定的控制標準來優化對動態系統的控制。然而，對神經網絡的訓練一般來說是比較耗時的。如果改變控制標準，那么常常持續比較長時間直至進行學習的神經網絡適應于經改變的控制標準。因而，對適用于所力求的目的或者新的情況的控制標準進行優化常常是非常耗時的。

發明內容

本發明的任務是提供一種用于對技術系統進行計算機輔助的控制優化的設備和方法，所述設備和方法允許對控制標準進行更靈活的并且更快速的優化。

該任務通過一種具有專利權利要求1的特征的交互式輔助系統、通過一種具有專利權利要求9的特征的方法以及通過具有專利權利要求13的特征的計算機程序產品來解決。

按照本發明，為了對技術系統進行計算機輔助的控制優化，設置一種交互式輔助系統以及一種相對應的方法。該技術系統例如可以是燃氣輪機、風力渦輪機、發電廠或者另一技術設施或者另一技術系統。輸入終端用于讀入說明了該技術系統的第一系統狀態的至少一個狀態參數，以及用于讀入至少一個調整參數，所述至少一個調整參數用于設立適用于訓練神經網絡的報酬函數（Belohnungsfunktion）。這樣的報酬函數常常也被稱作Reward-Function。仿真模塊用于對在技術系統上執行從第一系統狀態出發的行動序列進行仿真，以及用于預測技術系統的從中最終得到的后續狀態。此外，還設置有與輸入終端和仿真模塊耦合的優化模塊。該優化模塊用于依據調整參數設立報酬函數、用于生成多個針對第一系統狀態的行動序列、用于將所述行動序列傳送給仿真模塊以及用于接收從中最終得到的后續狀態。此外，該優化模塊還用于借助于所設立的報酬函數來確定對于最終得到的后續狀態所要期望的報酬，以及用于確定進行報酬優化的行動序列。為了輸出從進行報酬優化的行動序列最終得到的系統狀態而設置有輸出終端。

為了分別預先給定的情況和/或為了分別力求的目的，本發明允許快速地交互式地優化或改進針對技術系統的控制標準。通過適當地設立適用于神經網絡的訓練的報酬函數，所述控制標準可以以靈活的方式由用戶在輸入終端上來修改。這些修改的作用可以通過用戶在輸出終端上直接檢測。據此，用戶接著可以進行報酬函數或控制標準的其它適配，而且這樣可以連續地（sukzessiv）交互式地優化所述報酬函數或所述控制標準。將報酬函數用于優化控制標準是有利的，因為報酬函數根據其交互式優化而可以直接被用于訓練技術系統的基于神經網絡的控制。

仿真模塊的應用允許時間有利地并且成本有利地確定技術系統的由行動序列造成的后續狀態。這尤其是也適用于如下這種行動序列，所述行動序列在真正的技術系統上只能用高的耗費來執行。此外，在足夠的計算能力的前提下，仿真模塊常常可以比真正的技術系統更快地提供后續狀態，而且這樣可以縮短優化過程。

本發明的有利的實施方式和擴展方案在從屬權利要求中被說明。

根據本發明的一種有利的實施方式，所述仿真模塊可以被設立用于優化包括連續的調節參量的行動序列。這種連續的調節參量（諸如在燃氣輪機中的氣體輸送）在很多技術系統中都是可控制的。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于西門子公司，未經西門子公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201580035911.0/2.html，轉載請聲明來源鉆瓜專利網。