[發明專利]基于極限梯度提升樹模型的原料油品分子表征方法及系統在審
| 申請號: | 202210456463.3 | 申請日: | 2022-04-27 |
| 公開(公告)號: | CN114841065A | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 鐘偉民;杜文莉;錢鋒;彭鑫;田洲;段兆陽 | 申請(專利權)人: | 華東理工大學 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06K9/62;G01N33/28;G06F119/02 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陶玉龍;陸嘉 |
| 地址: | 200237 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 極限 梯度 提升 模型 原料 油品 分子 表征 方法 系統 | ||
1.一種基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,包括以下步驟:
步驟S1、根據制備工藝特性從宏觀物性參數中選取輸入特征向量,從物相組分中選取輸出特征向量;
步驟S2、對初始的制備工藝數據集進行預處理;
步驟S3、將步驟S2得到的數據集按照指定比例劃分為訓練集、驗證集和測試集;
步驟S4、構建基于極限梯度提升樹模型的原料油品分子表征模型,采用訓練集訓練模型,采用驗證集驗證模型的性能,調整模型參數以得到局部最優的模型;
步驟S5、采用測試集測試步驟S4所得的模型,得到符合評價指標的原料油品分子表征模型;
步驟S6、采用步驟S5所得的模型,對制備工藝過程中的原料油品進行分子表征。
2.根據權利要求1所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S1中:
所述輸入特征向量包括平均相對分子質量、相對密度、族組成數據、恩氏餾程、烷烴比重、芳烴比重;
所述輸出特征向量包括C4~C12的鏈烴、烯烴、環烷烴和芳香烴的摩爾分數。
3.根據權利要求1所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S2,進一步包括以下步驟:
步驟S21、對初始的制備工藝數據集的數據,剔除數據中的缺失值;
步驟S22、去除數據中的異常值;
步驟S23、去除數據中的噪聲;
步驟S24、對數據進行歸一化處理。
4.根據權利要求1所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S3,進一步包括以下步驟:
采用K折交叉驗證法劃分的訓練集、驗證集和測試集。
5.根據權利要求1所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S4,進一步包括以下步驟:
步驟S41、選擇基于極限梯度提升模型的弱分類器;
步驟S42、構建自定義模型迭代參數的目標函數;
步驟S43、調整模型對應的超參數,直至獲得局部最優的模型。
6.根據權利要求5所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S41,進一步包括
選擇基于極限梯度提升樹模型的的弱分類器。
7.根據權利要求5所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S42的目標函數,Obj對應的表達式為:
其中,i為數據集的樣本,m為樣本總數,K為迭代總次數,yi為實際值,為模型的預測值,l為損失函數,Ω為結構函數,f為葉子權重。
8.根據權利要求7所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S42的目標函數,對應的表達式為:
其中,gi和hi分別是在損失函數上對所求的一階和二階導數,T為葉節點的數量,λ為L2正則化系數,γ為最小目標減少量,Ij為索引為j的葉子所含樣本集合。
9.根據權利要求7所述的基于極限梯度提升樹模型的原料油品分子表征方法,其特征在于,所述步驟S43的超參數,進一步包括:
測試學習率、最小目標減少量、最大深度、L2正則化系數、放回隨機抽樣比例和弱評估器數量。
10.一種基于極限梯度提升樹模型的原料油品分子表征系統,包括:
存儲器,用于存儲可由處理器執行的指令;
處理器,用于執行所述指令以實現如權利要求1-9任一項所述的方法。
11.一種計算機可讀介質,其上存儲有計算機指令,其中當計算機指令被處理器執行時,執行如權利要求1-9任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東理工大學,未經華東理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210456463.3/1.html,轉載請聲明來源鉆瓜專利網。





