[發(fā)明專利]基于魯棒回歸建模預(yù)測烤片煙氣苯酚的方法有效
| 申請?zhí)枺?/td> | 201410386263.0 | 申請日: | 2014-08-07 |
| 公開(公告)號: | CN104143051B | 公開(公告)日: | 2018-11-09 |
| 發(fā)明(設(shè)計)人: | 白曉莉;段如敏;周桂圓;朱勇;謝志強;余賀龍;王保興;劉挺;盧偉 | 申請(專利權(quán))人: | 云南中煙工業(yè)有限責(zé)任公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 昆明正原專利商標代理有限公司 53100 | 代理人: | 金耀生 |
| 地址: | 650231 *** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 回歸 建模 預(yù)測 煙氣 苯酚 方法 | ||
1.一種基于魯棒回歸建模預(yù)測烤片煙氣苯酚的方法,其特征在于經(jīng)過下列各步驟:
(1)將已知烤片的理化數(shù)據(jù)與煙氣苯酚數(shù)據(jù)對應(yīng)列出,建立數(shù)據(jù)樣本集;所述理化數(shù)據(jù)包括總糖、還原糖、煙堿、總揮發(fā)堿、總氮、煙堿氮、蛋白質(zhì)、施木克值、氮堿比、氯、鉀、糖堿比和氨態(tài)堿;
(2)分別計算步驟(1)所得數(shù)據(jù)樣本集中各理化數(shù)據(jù)的列向量x1~xn和煙氣苯酚數(shù)據(jù)的列向量y,通過下列公式分別計算各理化數(shù)據(jù)與煙氣苯酚的線性相關(guān)系數(shù)r,線性相關(guān)系數(shù)r的絕對值大于0.3所對應(yīng)的該項理化數(shù)據(jù)即為對煙氣苯酚有重要影響的特征指標項,作為建模用的輸入變量:
式中:x為某一理化數(shù)據(jù)的列向量,y為煙氣苯酚數(shù)據(jù)的列向量;
(3)根據(jù)不同產(chǎn)地、品種、檔次,均勻挑選245個烤片作為訓(xùn)練樣本,運用魯棒回歸線性建模算法,建立煙氣苯酚預(yù)測模型,其表達式為下式:
Y=AX+b=a1x1+a2x2+…+anxn+b (2)
式中:Y為煙氣苯酚的模型預(yù)測值,X為理化數(shù)據(jù)向量,b為常數(shù)項,A為回歸系數(shù)向量;
所述步驟(3)運用魯棒回歸線性建模算法的步驟具體如下:
(a)進行局部權(quán)重回歸擬合:每一次擬合過程只考慮所有擬合點數(shù)的一部分,每一個被擬合點的取值都由與之鄰近的局部擬合范圍的散步點所決定,在每一個擬合點處都給予不同的權(quán)重系數(shù)Wi,其權(quán)重系數(shù)在擬合點處為1,局部擬合范圍內(nèi)擬合點的兩邊各點的權(quán)重系數(shù)依次以一定的規(guī)則遞減至零,超出擬合范圍的數(shù)據(jù)點處的權(quán)重均為0,其代數(shù)表達式為:
式中:Wi為每個擬合點的權(quán)重系數(shù),yi為實測值,為計算值;
(b)按下式計算調(diào)整殘差:
h=X(XTX)-1XT
式中:ri為普通最小二乘法的殘差,hi為殘差調(diào)整杠桿值,用于降低影響擬合值較大點處的權(quán)重,T為轉(zhuǎn)置;
標準調(diào)整殘差由下式給出:
式中:K為調(diào)整參數(shù),取4.685;s為魯棒性偏差;MAD是殘差的中值絕對偏差;
(c)按下式計算在局部擬合范圍內(nèi)每一點的魯棒性權(quán)重:
(d)對于式(2),將常數(shù)項b納入到回歸系數(shù)向量中,則式(2)簡化為:
Y=a1x1+a2x2+…+anxn+b
=(a1,a2,…,an,b)×(x1,x2,…,xn,1)T
=AX
依據(jù)權(quán)重最小二乘法求解使得下式取最小值的回歸系數(shù)向量A,并計算在x0處的值:
式中:J為權(quán)重最小二乘法求解的目標函數(shù);
所述步驟(3)的預(yù)測模型通過下列各步驟對擬合性能和推廣性能進行評價:
根據(jù)不同產(chǎn)地、品種、檔次,均勻挑選45個與步驟(3)不同的烤片理化數(shù)據(jù)作為測試樣本,套用至步驟(3)的預(yù)測模型中進行性能測試,預(yù)測結(jié)果需同時滿足如下兩個條件,即判定模型性能達到預(yù)測要求:
A、測試樣本與訓(xùn)練樣本的預(yù)測平均誤差相當(dāng),即為下式所示:
式中:errtrain為預(yù)測模型對訓(xùn)練樣本的平均誤差,errtest為預(yù)測模型對測試樣本的平均誤差;
B、測試樣本的預(yù)測值與實際值呈顯著的線性相關(guān)關(guān)系,即為下式所示:
式中:為測試樣本的預(yù)測值,y為測試樣本的實測值。
(4)依據(jù)步驟(2)選擇的特征指標項,將待測烤片的對應(yīng)理化數(shù)據(jù)作為輸入變量套用至步驟(3)的預(yù)測模型中,即能測算得到待測烤片的煙氣苯酚的模型預(yù)測值Y;
所述步驟(d)的魯棒性權(quán)重若其擬合誤差未達到下列擬合誤差要求時,從步驟(b)開始迭代計算,直至誤差達到要求或達到限定迭代次數(shù)為止:
煙氣苯酚預(yù)測模型的表達式為:Y=-12.41160+5.63069*煙堿+87.22102*總氮-60.11223*煙堿氮-12.91135*蛋白質(zhì)-4.70685*氮堿比+0.50795*糖堿比。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云南中煙工業(yè)有限責(zé)任公司,未經(jīng)云南中煙工業(yè)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410386263.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





