[發明專利]一種提高鋼鐵能源利用率的在線能源分配控制方法有效
| 申請號: | 201510367888.7 | 申請日: | 2015-06-29 |
| 公開(公告)號: | CN104977911B | 公開(公告)日: | 2017-09-19 |
| 發明(設計)人: | 唐立新;張顏顏 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G05B19/418 | 分類號: | G05B19/418 |
| 代理公司: | 沈陽東大知識產權代理有限公司21109 | 代理人: | 梁焱 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提高 鋼鐵 能源 利用率 在線 分配 控制 方法 | ||
1.一種提高鋼鐵能源利用率的在線能源分配控制方法,其特征在于:包括以下步驟:
步驟1、獲取鋼鐵生產的歷史數據,包括工序名稱、工序產量、氣溫、生產周期長度、消耗的能源介質種類、消耗的能源介質數量、能源介質回收量、各生產工序的設備檢修信息和能源介質供應信息;所述的能源介質供應信息包括焦炭供應量、煤供應量、天然氣供應量、高爐煤氣供應量、焦爐煤氣供應量、壓縮空氣供應量、蒸汽供應量、氧氣供應量、氮氣供應量、電供應量、水供應量、氮氣供應量、氬氣供應量和氫氣供應量;
步驟2、以每個工序的能源介質投入量限制為約束條件,采用建立數學模型的方式描述每個工序能源介質投入量的分配過程;
所述的數學模型,建立過程如下:
步驟2.1、設置數學模型的參數:包括設定能源分配周期為T,時間段序號為t;工序總數為I,工序序號為i;能源介質種類數為J,能源介質序號為j;能源j在t時間段的單位成本為cjt;能源j在t時間段的供應量為Sjt;工序i消耗能源j的二次能源產生率為αij;工序i在t時間段能源j投入不足時的單位懲罰為工序i在t時間段能源j投入過量時的單位懲罰為
步驟2.2、設定數學模型的動作變量為:工序i在t時間段對能源介質j的投入量xijt;
步驟2.3、根據每個工序的能源介質投入量限制設置數學模型的約束條件,具體如下:
(1)任意一個生產時間段內,能源介質的總投入量小于等于本時間段該能源介質的可用量,公式如下:
其中,xij,t-1表示工序i在t-1時間段對能源介質j的投入量;
(2)任意一個生產時間段內,能源介質的投入量大于等于0;
步驟2.4、根據最小化每個工序的能源介質投入成本、每個工序能源介質投入不足時的懲罰成本和每個工序能源介質投入過量時的放散成本,建立數學模型,其目標函數如下:
其中,z表示能源介質分配的目標函數,dijt表示工序i在t時間段對能源介質j的需求量;
步驟3、確定每個工序能源介質在每個時間段投入量的分配方案,具體步驟如下:
步驟3.1、以歷史數據中每個工序在每個時間段的生產量和氣溫作為輸入值,將能源介質實時需求量作為輸出值,建立能源介質實時需求量的機器學習模型;
步驟3.2、初始化機器學習模型的參數:設定工序i在t時間段的產量為s1it,工序i在t時間段的氣溫為s2it,系統狀態為設定t時刻采取的動作為at,at所有取值的集合At為動作空間;設定工序i在t時間段的系統狀態空間為Sit,即所有系統狀態的集合;設定貢獻函數為能源介質實際需求量與預測得到的能源介質需求量之差的絕對值;設定探索概率初始值、探索停止閾值、學習參數初始值和學習停止閾值;
步驟3.3、初始化能源介質實時需求量的機器學習模型,具體步驟如下:
步驟3.3.1、初始化所有狀態-動作對的值函數為0;
步驟3.3.2、迭代初始時,從均勻分布中產生一個隨機數,判斷該隨機數是否小于探索概率初始值,若是,執行步驟3.3.3,否則,執行步驟3.3.5;
步驟3.3.3、在動作空間內隨機選擇動作并作用于環境,得到新的系統狀態,同時獲得新的系統狀態對應的貢獻函數;
步驟3.3.4、根據獲得的新的系統狀態對應的貢獻函數,獲得新的系統狀態對應的值函數,根據探索概率更新公式更新探索概率,并執行步驟3.3.7;
步驟3.3.5、在動作空間內選擇貪婪動作作為初始系統狀態對應的動作并作用于環境,得到新的系統狀態,同時獲得新的系統狀態對應的貢獻函數;
步驟3.3.6、根據獲得的新的系統狀態對應的貢獻函數,獲得新的系統狀態對應的值函數,并根據探索概率更新公式更新探索概率;
步驟3.3.7、判斷更新后的探索概率是否大于所設定探索停止閾值,若是,返回執行步驟3.3.2進行迭代,否則,執行步驟3.3.8;
步驟3.3.8、初始化結束,將此時每個系統狀態對應的值函數設定為每個系統狀態對應的初始值函數;
步驟3.4、采用能源介質實時需求量的機器學習模型對狀態-動作對對應的值函數進行學習,具體步驟如下:
步驟3.4.1、設定初始學習次數為1,設定學習次數閾值;
步驟3.4.2、在初始系統狀態下,選擇初始動作作用于環境,得到新的系統狀態,同時獲得新的系統狀態對應的貢獻函數;
步驟3.4.3、根據新的系統狀態對應的貢獻函數,獲得新的系統狀態對應的值函數;
步驟3.4.4、根據新的系統狀態對應的貢獻函數和值函數,學習新的系統狀態對應的狀態-動作對最優值函數;
步驟3.4.5、判斷新的系統狀態-動作對對應的最優值函數與上一次系統狀態-動作對對應的最優值函數之差,是否大于所設定學習停止閾值,若是,執行步驟3.4.6,否則,執行步驟3.5;
步驟3.4.6、判斷學習次數是否達到所設定學習次數閾值,若是,執行步驟3.5,否則,執行步驟3.4.7;
步驟3.4.7、根據學習參數初始值,更新學習參數,將迭代次數加1,返回執行步驟3.4.2,根據更新后的學習參數進行迭代;
步驟3.5、完成學習,此時每個系統狀態對應的動作為最優動作,即能源介質實時需求量;
步驟3.6、采用學習完成后的能源介質實時需求量的機器學習模型,根據下一個分配周期內每個工序在未來計劃期內的生產量和氣溫,預測每個工序在未來計劃期內的能源介質實時需求量;
步驟3.7、根據預測得到的每個工序在每個時間段的能源介質實時需求量,并根據目標函數和約束條件,獲得目標函數最小時每個工序在每個時間段的能源介質投入量;
步驟4、工作人員根據每個工序在每個時間段的能源介質投入量,控制能源中心的PC端將能源介質按時間段分配給各生產工序,完成生產任務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510367888.7/1.html,轉載請聲明來源鉆瓜專利網。





