[發明專利]循環流化床生活垃圾焚燒鍋爐CO排放預測系統及方法有效
| 申請號: | 201710110224.1 | 申請日: | 2017-02-27 |
| 公開(公告)號: | CN107038334B | 公開(公告)日: | 2019-12-17 |
| 發明(設計)人: | 尤海輝;馬增益;唐義軍;王月蘭;嚴建華;倪明江;池涌;岑可法;黃群星 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G16C20/10 | 分類號: | G16C20/10;G06K9/62 |
| 代理公司: | 33200 杭州求是專利事務所有限公司 | 代理人: | 劉靜;邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 循環 流化床 生活 垃圾 焚燒 鍋爐 co 排放 預測 系統 方法 | ||
1.一種循環流化床生活垃圾焚燒鍋爐CO排放的實時預測系統,其特征在于,該系統與循環流化床鍋爐的集散控制系統以及生產管理系統相連,包括數據通訊接口和上位機,在上位機中對CO排放預測模型進行訓練和更新,然后將預測結果通過通訊接口送往集散控制系統和生產管理系統,所述上位機包括:
第一信號采集模塊;該模塊用于采集CFB生活垃圾焚燒鍋爐在焚燒指定生活垃圾時的運行工況狀態參數和操作變量,并組成垃圾熱值預測模型輸入變量的訓練樣本矩陣X(m×n),m表示樣本個數,n表示變量的個數;
數據預處理模塊;對X(m×n)進行粗大誤差處理和隨機誤差處理,剔除訓練樣本中的野值,排除異常工況,將訓練樣本輸入變量經過歸一化處理后映射到[0,1]區間內,得到歸一化后的訓練樣本X*(m×n);所述異常工況包括鍋爐停爐運行工況、爐膛壓火運行狀況和給料機堵塞工況;
模型更新模塊;該模塊對CO排放預測模型的性能進行判斷,并決定是否對預測模型進行更新,當CO排放量與模型預測排放量的誤差超過±5%時,更新模型;
智能學習模塊;該模塊先利用Gamma Test算法尋找最優的訓練樣本尺寸,然后利用隨機森林算法對樣本進行訓練學習,具體步驟如下:
1)利用Gamma Test算法尋找最優的訓練樣本尺寸;對于如下形式的數據集
{(Xi,Yi),1≤i≤m} (2)
式中,Xi表示輸入,Xi∈Rn,對應的輸出標量為y∈R;
Gamma Test假定的模型關系是:
y=f(x1,…,xn)+A (3)
式中,f是一個光滑函數,A是一個表示數據噪聲的隨機量;假定A的均值為0,否則可在f中加入常數項,方差為Var(y);Gamma Test就是計算一個統計量Γ,用它來評價輸出量的方差,如果數據的關系符合光滑模型,并且沒有噪聲,這個方差是0;Γ的計算過程如下:
1.1)計算輸入數據的距離統計量;用xi表示第i個輸入數據,xN[i,k]表示輸入樣本的第k近鄰域點,計算如下統計量:
式中,|·|表示歐拉距離,p為最遠鄰近距離(nearest neighbor);
1.2)計算輸出數據的距離統計量;用yi表示第i個輸出數據,yN[i,k]表示輸出樣本的第k近鄰域點,計算如下統計量:
式中符號的意義同(4)式;
1.3)計算統計量Γ;為了計算Γ,分別計算鄰近距離從1到p的統計量(δm(1),γm(1)),(δm(2),γm(2)),…,(δm(p),γm(p));對這p個統計量構造一元線性回歸模型,用最小二乘法進行擬合,得到的一次線性函數的截距就是Gamma Test統計量Γ,Γ值越小表示樣本中的噪聲越小;
定義另一個統計量Vratio:
式中,δ2(y)表示輸出y的方差;Vratio可以用來評價光滑模型對該數據的模擬能力,Vratio越接近0,表示該模型的預測性能越好;
2)將Gamma Test算法尋優得到最優訓練樣本用于構建隨機森林模型,隨機森林是一個由一組決策樹分類器{h(X,θk),k=1,2,…,K}組成的分類器,其中θk是服從獨立同分布的隨機向量,K表示隨機森林中決策樹的個數,在給定自變量X下,每個決策樹分類器通過投票來決定最優的分類結果;如果把決策樹看成分類任務中的一個專家,隨機森林就是許多專家在一起對某種任務進行分類;分類樹的實現按照自頂向下、遞歸分裂的原則進行,在所有分類樹中,根結點擁有全部訓練樣本數據,訓練過程依據純度最小原則,將根節點分裂為左節點和右節點,兩個節點分別設定為訓練數據的一個子集,按照相同的方式使節點繼續分裂下去,直到滿足分支終止條件而停止訓練,若在某個節點上的所有分類數據來自同一個類別,則該節點的純度為0,又稱為gini值;假設集合T中包含N個類別的記錄,并分裂成r個部分N1,N2,……,Nr,每個部分對應的集合為T1,T2,……,Tr,那么這個分裂的gini系數按照公式(7)和(8)計算:
式中,T指總的訓練樣本集,pj代表類別j出現的頻率,ginisplit(T)指所有類別的gini值;
生成隨機森林的具體步驟如下:
2.1)從原始訓練數據集T中,應用bootstrap方法有放回地隨機抽取K個新的自助樣本集,并由此構建K棵分類回歸樹,作為根結點開始訓練;
2.2)設總共有n個特征,則在每一棵樹的每個節點處隨機抽取mtry個特征(mtry≤n),通過計算每個特征蘊含的信息量,在mtry個特征中選擇一個最具有分類能力的特征進行節點分裂;
2.3)每棵樹最大限度地生長,不做任何剪裁;
2.4)將生成的多棵樹組成隨機森林,對于回歸問題,預測輸出為所有樹輸出值的平均值,得到訓練好的CO排放預測模型;
3)利用訓練好的CO排放預測模型和測試樣本對模型進行測試,如果模型的預測CO排放量和實際CO排放量的相對預測誤差超過±5%時,則重新選擇樣本進行訓練,直到滿足精度要求為止;
第二信號采集模塊;用于從數據庫中選擇需要預測CO排放的運行工況,或者實時地采集當前鍋爐的運行工況;
預測模塊;該模塊用于對指定的樣本進行CO排放預測,或者對當前鍋爐運行工況下的CO排放進行實時預測;
結果顯示模塊;顯示CO排放的預測結果,或者對CO排放的預測結果進行統計分析。
2.一種循環流化床生活垃圾焚燒鍋爐CO排放預測方法,其特征在于,該方法包括以下步驟:
1)分析循環流化床生活垃圾焚燒鍋爐的運行機理和CO生成機理,選擇垃圾的給料量、給煤量、一次風量、二次風量、煙氣含氧量、爐膛負壓、床層溫度、爐膛稀相區溫度作為CO排放預測模型的輸入變量;
2)采集訓練樣本;按設定的時間間隔從數據庫中采集輸入變量的歷史數據,或者采集指定工況下的運行參數,組成CO排放預測模型輸入變量的訓練樣本矩陣X(m×n),m表示樣本個數,n表示變量的個數,同時采集與之對應的CO排放量作為模型的輸出訓練樣本Y(m×1);
3)數據預處理;對X(m×n)進行粗大誤差處理和隨機誤差處理,以摒除那些并不是反映鍋爐正常運行工況的虛假信息,將鍋爐停爐、壓火、給料機堵塞異常工況排除掉,訓練樣本輸入變量經過歸一化處理后映射到[0,1]區間內,得到標準化后的輸入變量的訓練樣本X*(m×n)和輸出變量的訓練樣本Y*(m×1);
4)利用Gamma Test算法尋找最優的訓練樣本尺寸;對于如下形式的數據集:
{(Xi,Yi),1≤i≤m} (1)
式中,Xi表示輸入,Xi∈Rn,對應的輸出標量為y∈R;
Gamma Test假定的模型關系是:
y=f(x1,…,xn)+A (2)
式中,f是一個光滑函數,A是一個表示數據噪聲的隨機量;不失一般性,可假定A的均值為0(否則可在f中加入常數項),方差為Var(y);Gamma Test就是計算一個統計量Γ,用它來評價輸出量的方差,顯然,如果數據的關系符合光滑模型,并且沒有噪聲,這個方差是0;Γ的計算過程如下:
4.1)計算輸入數據的距離統計量;用xi表示第i個輸入數據,xN[i,k]表示輸入樣本的第k近鄰域點,計算如下統計量:
式中,|·|表示歐拉距離,p為最遠鄰近距離(nearest neighbor);
4.2)計算輸出數據的距離統計量;用yi表示第i個輸出數據,yN[i,k]表示輸出樣本的第k近鄰域點,計算如下統計量:
式中符號的意義同(3)式;
4.3)計算統計量Γ;為了計算Γ,分別計算鄰近距離從1到p的統計量(δm(1),γm(1)),(δm(2),γm(2)),…,(δm(p),γm(p));對這p個統計量構造一元線性回歸模型,用最小二乘法進行擬合,得到的一次線性函數的截距就是Gamma Test統計量Γ,Γ值越小表示樣本中的噪聲越小;
定義另一個統計量Vratio:
式中,δ2(y)表示輸出y的方差;Vratio可以用來評價光滑模型對該數據的模擬能力,Vratio越接近0,表示該模型的預測性能越好;
5)將Gamma Test算法尋優得到最優訓練樣本用于構建隨機森林模型,隨機森林是一個由一組決策樹分類器{h(X,θk),k=1,2,…,K}組成的成分類器,其中θk是服從獨立同分布的隨機向量,K表示隨機森林中決策樹的個數,在給定自變量X下,每個決策樹分類器通過投票來決定最優的分類結果;如果把決策樹看成分類任務中的一個專家,隨機森林就是許多專家在一起對某種任務進行分類;分類樹的實現按照自頂向下、遞歸分裂的原則進行,在所有分類樹中,根結點擁有全部訓練樣本數據,訓練過程依據純度最小原則,將根節點分裂為左節點和右節點,兩個節點分別設定為訓練數據的一個子集,按照相同的方式使節點繼續分裂下去,直到滿足分支終止條件而停止訓練,若在某個節點上的所有分類數據來自同一個類別,則該節點的純度為0,又稱為gini值;假設集合T中包含N個類別的記錄,并分裂成r個部分N1,N2,……,Nr,每個部分對應的集合為T1,T2,……,Tr,那么這個分裂的gini系數按照公式(6)和(7)計算:
式中,T指總的訓練樣本集,pj代表類別j出現的頻率,ginisplit(T)指所有類別的gini值;
生成隨機森林的具體步驟如下:
5.1)從原始訓練數據集T中,應用bootstrap方法有放回地隨機抽取K個新的自助樣本集,并由此構建K棵分類回歸樹,作為根結點開始訓練;
5.2)設總共有n個特征,則在每一棵樹的每個節點處隨機抽取mtry個特征(mtry≤n),通過計算每個特征蘊含的信息量,在mtry個特征中選擇一個最具有分類能力的特征進行節點分裂;
5.3)每棵樹最大限度地生長,不做任何剪裁;
5.4)將生成的多棵樹組成隨機森林,對于回歸問題,預測輸出為所有樹輸出值的平均值,得到訓練好的CO排放預測模型;
6)利用訓練好的CO排放預測模型和測試樣本對模型進行測試,如果模型的預測CO排放量和實際CO排放量的相對預測誤差超過±5%時,則重新選擇樣本進行訓練,直到滿足精度要求為止;
7)模型自適應更新;當CO排放量與模型預測排放量的誤差超過±5%時,立即更新模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710110224.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種簡易電動爬梯
- 下一篇:一種新型叉式移載升降機





