[發明專利]設備的控制裝置和控制方法及火力發電設備及其控制方法有效
| 申請號: | 200680053057.1 | 申請日: | 2006-12-27 |
| 公開(公告)號: | CN101379447A | 公開(公告)日: | 2009-03-04 |
| 發明(設計)人: | 關合孝朗;清水悟;山田昭彥 | 申請(專利權)人: | 株式會社日立制作所 |
| 主分類號: | G05B13/02 | 分類號: | G05B13/02;F22B35/00;F23N3/02;F23N5/00 |
| 代理公司: | 中科專利商標代理有限責任公司 | 代理人: | 李貴亮 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 設備 控制 裝置 方法 火力發電 及其 | ||
技術領域
本發明涉及設備(plant)的控制裝置和控制方法。另外,涉及火力發 電設備及其控制方法。
背景技術
在設備的控制裝置中,對從作為控制對象的設備中獲取的測量信號進 行處理,算出發送給控制對象的操作信號。在控制裝置中,安裝有計算操 作信號的阿拉伯式計數法(algorithm),以使設備測量信號達到運行目標。
作為設備的控制中使用的控制阿拉伯式計數法,有PI(比例、積分) 控制算法。該算法是通過對運行目標值和測量信號的偏差乘以比例增益, 并對所得值加上將偏差進行時間積分后的值,從而導出操作信號。另外, 還已知使用學習算法導出設備的操作信號。
另外,近年來,在無老師的學習領域中,有被稱為強化學習的方法。 強化學習被公知是通過與控制對象的試行錯誤的相互作用,以使從控制對 象獲取到的測量信號為理想的信號的方式,對發送給控制對象的操作信號 的生成方法進行學習的學習控制的組成。
在強化學習中,著手于使用從控制對象獲取的信號而計算出的數量 (scalar)的評價值(強化學習中,被稱為報酬),以從目前狀態到將來為 止獲得的評價值的期待值達到最大的方式,來學習操作信號的生成方法。
在非專利文獻1中,記載有這樣的方法,在測量信號達到運行目標值 時給予正的評價值,并使用Actor-Critic、Q學習、實際時間Dynamic Programming等的算法,來學習操作信號的生成方法。另外,作為發展該 方法的方式,介紹了被稱為Dyna-體系結構的組成。該組成中,在控制裝 置內具有模擬控制對象的模型。模型將發送給控制對象的操作信號作為模 型輸入進行收納,算出控制對象的測量信號的預測值亦即模型輸出。該模 型使用物理式或統計的手法而建成。另外,著眼于使用模型輸出而計算出 來的評價值,學習模型輸入的生成方法。
在Dyna-體系結構中,為了達到模型輸出目標值,而預先學習模型輸 入的生成方法,并根據該學習結果決定施加到控制對象的操作信號。
非專利文獻1:“強化學習”(Reinforcement?Learning)、三上貞芳·皆 川雅章共譯、森北出版株式會社,2000年12月20日出版,第142~172 頁,第247~253頁
在設計上述的設備的控制裝置時,需要合適地設定運行目標值以及模 型輸出目標值。特別是在決定模型輸出目標值時,需要解決以下問題。
上述的模型輸出有時是控制對象測量信號的評價值。假如,運行目標 值和模型輸出目標值被設定成相同的值,則即便對控制對象發送根據達到 該模型輸出目標值的模型輸出而生成的操作信號,測量信號仍有可能達不 到運行目標。在操作信號為恒定條件下,運行控制對象,且此時得到的測 量信號變動的情況下,測量信號的平均值在運行目標值以下,在某一時間 段內仍有可能超過運行目標值。此時,即使模型輸出達到運行目標值,測 量信號仍無法達成運行目標。因此,為了使測量信號達到運行目標值,需 要考慮測量信號的變動幅度來決定模型輸出目標值。
發明內容
本發明的目的在于提供一種可解決上述問題的具備計算運行目標值 的功能的設備控制裝置以及控制方法。
本發明在于提供一種設備的控制裝置,該控制裝置具備生成向作為控 制對象的設備所發送的操作信號的操作信號生成部,其特征是,利用:模 型、即預測在向上述控制對象發送操作信號時所得到的測量信號的值的模 型;模型輸出目標值決定單元、即利用由上述控制對象中得到的測量信號 和預先設定的測量信號的限制值,決定模型輸出目標值的模型輸出目標值 決定單元;和學習單元、即學習模型輸入的生成方法,以使上述模型的預 測結果亦即模型輸出達到模型輸出目標值的學習單元,
一邊參見數據庫、即保存有對達到模型輸出目標值的模型輸入的生成 方法進行學習的結果的數據庫,一邊在上述操作信號生成部中生成操作信 號。
本發明的控制裝置,具備利用設備的測量信號、預先設定的測量信 號的限制值來決定模型輸出目標值的功能。通過使用該功能,可以處理 測量信號,導出測量信號的平均值、最大值、最小值。
在測量信號變動的情況下,可以將從測量信號的限制值中,減去測 量信號的最大值和平均值的差值的絕對值后的值作為模型輸出目標值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社日立制作所,未經株式會社日立制作所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680053057.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種便攜式嬰幼兒折疊蚊帳
- 下一篇:一種多功能靠墊





