[發明專利]一種工藝參數驅動的三甘醇脫水裝置三甘醇損耗量在線預測方法在審
| 申請號: | 202110340674.6 | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN113088359A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 尹愛軍;何彥霖;任宏基;譚治斌 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | C10L3/10 | 分類號: | C10L3/10;G16C20/10;G16C20/70;G06N20/20;G06N5/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 400044 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 工藝 參數 驅動 甘醇 脫水 裝置 損耗 在線 預測 方法 | ||
1.一種工藝參數驅動的三甘醇脫水裝置三甘醇損耗量在線預測方法,其特征在于,包括以下步驟:
步驟S1:對于具有N個工藝監測參數的三甘醇脫水裝置,將各參數依次編號為參數1至參數N,將N個工藝參數和三甘醇損耗量數據組成預測模型原始訓練數據集X,數據集共有M個樣本,將各樣本依次編號為樣本1至樣本M;
步驟S2:建立用于特征選擇的極端梯度提升樹(eXtreme Gradient Boosting,XGBoost)模型,所述XGBoost模型由多棵串行的決策樹組成,所述決策樹為分類回歸樹(Classification and regression tree,CART),模型當前決策樹的建立依賴已建立好的決策樹模型,即對于當前正構建的第t棵決策樹的目標擬合值為前t-1棵決策樹的損失值,所述損失值為目標值與預測值的差,直至模型收斂時模型訓練完成,當模型訓練完成時計算XGboost模型中每個工藝參數特征作為分裂條件時的平均增益判斷工藝參數的重要性,所述平均增益為工藝參數j總的增益和除以樹分裂中參數j出現的總頻次,設定模型訓練時所需的相關參數,設定均方誤差為模型的損失函數,以及設定模型損失函數正則項的葉節點復雜性系數γ、懲罰系數λ,決策樹的數量、決策樹最大深度和學習率,所述損失函數、葉節點復雜性系數γ、懲罰系數λ用于控制決策樹節點的分裂,所述決策樹的數量、決策樹最大深度和學習率是為了防止模型過擬合;
步驟S3:訓練模型,建立XGBoost的第t棵樹,所述1≤t≤決策樹的數量,計算當前未分裂決策樹節點的最大增益,所述最大增益是決策樹分裂的判定標準,所述最大增益計算過程:依次遍歷所有參數特征k=1,2,…,N,將參數特征k的樣本值從小到大排列,所述參數特征k的樣本值只含有參數特征k的值,但分裂時該樣本包含其它特征的值作為一個整體分裂,依次取出第i個樣本,將小于該樣本值的樣本放入左子樹,計算左右子樹各樣本的損失函數的一階導數和GL、GR和二階導數和HL、HR,獲得當前節點分裂的增益,所述增益的計算過程為:當遍歷完成后,一種最大增益對應的參數特征和參數值分裂子樹,所述節點分裂,如第Xk個工藝參數的第i個樣本值xki,則當前節點分裂標準為Xjkxki,所有滿足分裂條件的樣本分入左子樹,其余樣本分入右子樹,并計算左右子樹各樣本的權值wi,所述權值是滿足某決策樹分裂條件的預測值,左子樹各樣本權重值:右子樹各樣本權重值:當模型建立完成時,預測值由測試樣本滿足模型中所有分裂條件的葉節點的權值求和得到;
步驟S4:重復步驟S3,完成第t棵決策樹的訓練,該決策樹建立完成的條件為:直到所有的節點分裂完畢或達到決策樹最大深度,所述節點分裂完畢,表示該節點只有一個樣本,得到訓練完成的第t棵決策樹;
步驟S5:重復步驟S3~步驟S4,直到所有的決策樹建立完畢,得到參數特征選擇模型;
步驟S6:分別計算XGboost模型中每個工藝參數特征作為分裂條件時的平均增益。所述平均增益用于表征工藝參數對目標參數的重要程度。將所有工藝參數的平均增益排序,設定閾值選擇關鍵工藝參數,得到特征選擇后的訓練數據集;
步驟S7:對于特征選擇后的訓練數據集,設定RF決策樹的數量,所述決策樹為CART樹,所述RF模型由并行的決策樹組成,每個決策樹為一個為弱學習器,將所有弱學習器得到的結果進行算術平均得到最終的預測值,RF模型采用bagging的集合策略訓練模型,所述bagging方法在一次抽取中,有的樣本被多次抽到,有的樣本未抽到,每個訓練子集的大小約為特征選擇后的訓練數據集的三分之二,每一次抽取用于訓練一個弱學習器,該抽樣方法使決策樹具有泛化能力很強的特點;
步驟S8:訓練模型,建立RF的第i棵樹,所述1≤i≤決策樹的數量,通過bagging方法從特征選擇后的訓練數據集中有放回的抽取M個樣本作為新的訓練子集,對于當前的RF第i棵決策樹,對每個節點的分裂,該節點含有Nd個參數特征,從Nd個工藝參數特征屬性中隨機選取Ntry個作為候選分裂屬性,所述NtryNd,根據平方誤差最小化準則從Ntry個工藝參數特征屬性中,選擇最優分裂屬性作為節點分裂的指標進行分裂,所述最優分裂屬性即選用平方誤差最小的工藝參數特征屬性,其最優分裂屬性計算過程為:依次遍歷所有參數特征k=1,2,…,Ntry和第k個參數在該節點的樣本值,即對于第k個參數特征及該參數特征的某個樣本值s,分別作為分裂變量和分裂條件值,依據公式R1(k,s)={x|x(k)≤s},R2(k,s)={x|x(k)>s}選擇最優分裂特征和分裂值,所述yi為樣本目標值,c1為R1所有樣本目標值的均值和c2為R2所有樣本目標值的均值,并將c1和c2作為分裂后左右子樹節點的預測值;
步驟S9:重復步驟S8,當節點的數據量小于指定數量時或平方誤差收斂,節點停止續分裂,所述節點停止分裂表示,第i棵決策樹訓練完成;
步驟S10:重復步驟S8~步驟S9,直至所有的RF決策樹建立完畢,得到訓練完成的預測模型;
步驟S11:進行三甘醇脫水裝置損耗量在線預測,對于三甘醇脫水裝置歷史工藝參測數據,依據步驟S6選取預測模型對工藝參測數據進行特征選擇,對于特征選擇的數據集,利用步驟7~步驟10建立RF三甘醇脫水裝置三甘醇損耗量預測模型。將三甘醇脫水裝置實時工藝參測數據作為RF預測模型的輸入,實現三甘醇脫水裝置三甘醇損耗量在線預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110340674.6/1.html,轉載請聲明來源鉆瓜專利網。





