[發明專利]基于魯棒回歸建模預測烤片煙氣苯酚的方法有效
| 申請號: | 201410386263.0 | 申請日: | 2014-08-07 |
| 公開(公告)號: | CN104143051B | 公開(公告)日: | 2018-11-09 |
| 發明(設計)人: | 白曉莉;段如敏;周桂圓;朱勇;謝志強;余賀龍;王保興;劉挺;盧偉 | 申請(專利權)人: | 云南中煙工業有限責任公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 昆明正原專利商標代理有限公司 53100 | 代理人: | 金耀生 |
| 地址: | 650231 *** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 回歸 建模 預測 煙氣 苯酚 方法 | ||
本發明提供一種基于魯棒回歸建模預測烤片煙氣苯酚的方法,通過已有的烤片理化數據和煙氣苯酚數據建立從理化指標項到煙氣苯酚的模型,對于未知烤片煙氣苯酚樣本,可以利用其理化成分數據直接預測烤片煙氣苯酚值。本發明省去了由傳統化學方式進行卷制、燃燒、捕捉煙氣、檢測等步驟;同時,采用魯棒回歸模型,可以有效地避免因理化數據或煙氣數據中奇異值樣本導致的弊端,很大程度上保證模型的健壯性,這點正是魯棒回歸建模優于普通線性回歸建模的優點。實踐證明,該模型能夠有效地預測烤片的煙氣苯酚值,極大地提高檢測效率,降低檢測成本。
技術領域
本發明涉及一種基于魯棒回歸建模預測烤片煙氣苯酚的方法,屬于特定計算模型技術領域。
背景技術
煙草煙氣是一種極為復雜的混合物,它是在卷煙抽吸過程中由煙草燃燒、裂解和蒸餾而產生的。卷煙制品對于人體的危害性是通過燃吸過程而產生的。煙氣中的有害成分主要是在燃燒過程中形成,而煙氣的化學特性是隨煙葉原料內在化學成分的變化而變化的。因此,卷煙煙葉原料的化學特性決定了卷煙煙氣的化學特性和安全性。苯酚是卷煙主流煙氣中的一個重要有害成分,在煙草燃燒時直接進入煙氣,產生不好的氣味,而且很難被掩蓋,對呼吸系統有腐蝕作用和助癌作用。傳統的烤片煙氣苯酚數據的獲得方式是檢測烤片燃燒后的煙氣中的化學成分指標。通過這種方式獲得的煙氣數據,需要將烤片卷制成卷煙燃燒后的煙氣進行化學檢測,檢測過程費時費力且檢測成本極高。
在線性回歸建模中,模型是建立在一定假設條件基礎上的,例如被觀測樣本誤差為標準正態分布。如果誤差的分布是非對稱或者傾向于離群點,那么進行線性回歸建模的假設是不成立的,參數的估計、置信區間以及其他計算的統計量都是不可靠的。這種情況下,用魯棒回歸進行模型的建立是非常有效的。魯棒回歸建模包含了一種健壯的擬合方法,與最小二乘法相比,對于數據中小部分的變異沒有那么敏感,提高了模型的可信度。
魯棒回歸通過為每個數據點賦予一個權值進行建模。加權是自動的并且是重復的,這個過程叫做自動重加權最小二乘法。在第一階段,每個樣本點被賦予相同的權重,然后利用普通的最小二乘法計算得到模型系數。在隨后的迭代中,每個樣本的點都將重新計算,那些遠離模型預測值的樣本點將被賦予較低的權重。之后利用經過加權的最小二乘法計算模型系數。迭代過程將一直進行下去,一直到模型系數在一個設定的范圍波動。
因此以魯棒回歸建立一種預測模型由烤片理化數據直接獲取煙氣苯酚數據的方法勢在必行。
發明內容
為解決現有技術檢測烤片煙氣苯酚數據的過程費時、費力、成本極高等問題,本發明提出一種基于魯棒回歸建模預測烤片煙氣苯酚的方法。
本發明通過已有的烤片理化數據和煙氣苯酚數據建立從理化指標項到煙氣苯酚的魯棒回歸預測模型,對于未知烤片煙氣苯酚樣本,利用其理化成分數據套用模型直接預測烤片煙氣苯酚值。具體經過下列各步驟:
(1)將已知烤片的理化數據與煙氣苯酚數據對應列出,建立數據樣本集;
(2)分別計算步驟(1)所得數據樣本集中各理化數據的列向量x1~xn和煙氣苯酚數據的列向量y,通過下列公式分別計算各理化數據與煙氣苯酚的線性相關系數r,線性相關系數r的絕對值大于0.3所對應的該項理化數據即為對煙氣苯酚有重要影響的特征指標項,作為建模用的輸入變量:
式中:x為某一理化數據的列向量,y為煙氣苯酚數據的列向量;
(3)根據不同產地、品種、檔次,均勻挑選245個烤片作為訓練樣本,運用魯棒回歸線性建模算法,建立煙氣苯酚預測模型,其表達式為下式:
Y=AX+b=a1x1+a2x2+…+anxn+b (2)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南中煙工業有限責任公司,未經云南中煙工業有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410386263.0/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





