[發明專利]一種基于煙葉致香成分的多模型評價煙葉原料相似度的方法有效
| 申請號: | 201611162141.9 | 申請日: | 2016-12-15 |
| 公開(公告)號: | CN106645530B | 公開(公告)日: | 2018-07-24 |
| 發明(設計)人: | 高銳;楊威;宋鵬飛;王毅;李文均;李艷瓊;肖敏;張光煦;馬迅 | 申請(專利權)人: | 云南中煙工業有限責任公司 |
| 主分類號: | G01N30/86 | 分類號: | G01N30/86 |
| 代理公司: | 昆明正原專利商標代理有限公司 53100 | 代理人: | 金耀生;于洪 |
| 地址: | 650231 *** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 煙葉原料 相似度 煙葉 樣本 成分數據 馬氏距離 模型評價 驗證集 原料庫 煙草技術領域 計算相似度 數據信息 隨機選取 煙葉樣品 差異性 經驗證 數據組 訓練集 采樣 建模 驗證 分析 | ||
本發明涉及一種基于煙葉致香成分的多模型評價煙葉原料相似度的方法,屬于煙草技術領域。本發明的方法是通過蒙特卡洛無放回采樣,隨機選取一定比例的樣本作為訓練集,剩下的樣本作為模型內部驗證集;建立多個基于煙葉致香成分含量的主成分模型;利用內部驗證集樣本對模型的有效性進行驗證;將新煙葉原料的致香成分數據輸入經驗證有效的主成分模型,計算樣品在多個模型中的馬氏距離,對生成的馬氏距離數據組進行分析,評價新的煙葉原料與原料庫中煙葉原料的相似度。本發明與一次建模計算相似度方法相比較,更能充分提取所有樣品致香成分數據信息,也更能兼顧原料庫中煙葉樣品致香成分含量的差異性數據信息。
技術領域
本發明涉及一種基于煙葉致香成分的多模型評價煙葉原料相似度的方法,屬于煙草技術領域。具體是以某一品牌卷煙涉及煙葉原料的致香成分為基礎數據,通過構建煙葉原料相似度多模型評價體系,實現新煙葉原料與原庫中煙葉原料相似度評價,為挑選合適煙葉進入原料庫,維護煙葉原料庫供需平衡,保持同一品牌卷煙的風格特征提供輔助信息。
背景技術
面對國內外煙草消費市場的新形勢,“卷煙上水平”已成為我國煙草行業發展的基本方針和戰略任務。“卷煙上水平”就必須保證煙葉原料供應上水平,以品牌為導向的煙葉原料配置在煙葉原料供應上水平中發揮著重要的作用。品牌導向的煙葉原料配置就需要為同一品牌的卷煙配置特用的煙葉原料庫。當煙葉庫存用完,進行煙葉原料替代時需要選擇與替代樣品感官評吸相似度高,又與其它煙葉原料的感官相似度高的煙葉樣品,以保持同一品牌卷煙在抽吸風格特征上的一致性。
煙葉致香成分的種類和含量是卷煙風格特征的物質基礎。中國專利CN201210388661采用卷煙的致香物含量進行逐步回歸分析,建立了卷煙香型的定量化判定標準。中國專利CN201310551840通過對煙葉特征化學指標的篩選和取舍,然后進行主成分計算,建立了煙葉風格特征TQ的計算公式。上述兩個專利揭示了煙葉致香成分在保持卷煙風格特征方面發揮著重要作用。因此如何保持新挑選的煙葉原料必須與原料庫中煙葉原料在致香成分含量整體性上較高的相似度就顯得尤為重要。
中國專利CN200810030798基于煙葉的化學成分,采用主成分分析和馬氏距離搜索評價相似煙葉。中國專利CN201210344034基于煙葉的近紅外信息,采用主成分分析和馬氏距離判定相似煙葉樣品,輔助卷煙配方。上述兩個專利揭示了主成分分析能從整體性上較好的揭示多維煙草化學成分分析的整體性信息,馬氏距離能有效的計算兩個未知樣本集的相似度。
以上技術中,采用一次建模的主成分分析和馬氏距離計算和評價煙葉樣本相似度,存在以下不足:由于主成分模型中各樣本間存在一定的差異性,將所有樣品進行一次性建模難以排除與其它樣品差異性較大的個別樣品對主成分分析模型整體性的影響。一次性建模所采用的訓練集難以完全代表所有樣本的總體信息。
蒙特卡洛采樣是一種無放回采樣,也稱刀切法(Jack knife),機選取一定比例的樣本作為訓練集,剩下的樣本作為獨立測試集。進行蒙特卡洛采樣時需要設定采樣次數、訓練集和內部驗證集樣品個數的比例劃分。蒙特卡洛采樣能較好兼顧數據的整體性信息和差異性信息。
馬氏距離的計算公式: ,式中:為平均得分矩陣,為馬氏矩陣M的逆矩陣, 。 為樣本集中
發明內容
本發明的目的在于建立一種基于煙葉致香成分的多模型評價煙葉原料相似度的方法。本發明的意義在于:彌補一次建模的不足,使煙葉原料相似度評價更加科學和合理。
本發明的方法是通過蒙特卡洛無放回采樣,隨機選取一定比例的樣本作為訓練集,剩下的樣本作為模型內部驗證集;建立多個基于煙葉致香成分含量的主成分模型;利用內部驗證集樣本對模型的有效性進行驗證;將新煙葉原料的致香成分數據輸入經驗證有效的主成分模型,計算樣品在多個模型中的馬氏距離,對生成的馬氏距離數據組進行分析,評價新的煙葉原料與原料庫中煙葉原料的相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南中煙工業有限責任公司,未經云南中煙工業有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611162141.9/2.html,轉載請聲明來源鉆瓜專利網。





