[發明專利]基于隨機森林遷移學習的紅外光譜模型傳遞方法有效
| 申請號: | 201710037798.0 | 申請日: | 2017-01-18 |
| 公開(公告)號: | CN106815643B | 公開(公告)日: | 2019-04-02 |
| 發明(設計)人: | 陳媛媛;李墅娜;張瑞;王志斌;景寧 | 申請(專利權)人: | 中北大學 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 申紹中 |
| 地址: | 030051 山*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隨機 森林 遷移 學習 紅外 光譜 模型 傳遞 方法 | ||
本發明公開一種基于隨機森林遷移學習的紅外光譜模型傳遞方法,利用隨機森林思想將主儀器掃描的樣本數據集利用Bootstrap方法生成多個子數據集;針對每個子數據集,結合目標儀器掃描的樣本數據集,利用遷移學習算法建立目標儀器上的分析模型;針對目標儀器上采集的待測樣本紅外光譜,根據建立的每個分析模型預測其待測組分含量;計算每個待測樣本與建立的各個分析模型中樣本之間的結構分布相似度,以確定與每個待測樣本對應的各個目標分析模型權重因子;再利用加權平均方法對預測結果進行匯總,得到最終的待測組分含量。該方法具備魯棒性強、自適應的優點,有效提升模型傳遞的準確度和穩定性,可以廣泛應用于固相、液相和氣相的紅外光譜模型傳遞領域中。
技術領域
本發明涉及一種基于隨機森林遷移學習的紅外光譜模型傳遞方法,適用于不同廠家、不同型號紅外光譜儀的跨平臺模型通用方法。
背景技術
紅外光譜分析是一種新興的分析技術,由于它具有快速、無損和無污染等優點,在農業、化工和環境監測等領域有著廣泛的應用。紅外光譜分析技術要求紅外光譜儀和定性/定量分析模型必須協調工作,否則均會對分析結果由影響。然而,在實際的應用過程中,通常會存在紅外光譜儀生產廠家不同、型號不同等情況,致使所建立的分析模型無法適用于所有紅外光譜儀,而為每臺設備單獨建立一個分析模型,則會花費大量的人力物力和時間。
傳統的模型傳遞方法包括斜率截距法、直接校正法、分段直接校正法、Shenk’s法等。但是上述幾種方法均為有標樣方法,即事先準備好多個標準樣本,分別在主儀器和目標儀器上對這些樣本進行光譜掃描,接著利用數學方法確定兩者間的映射關系。對于新的待測樣本,在目標儀器上掃描光譜后,利用映射函數對其進行轉換,再使用主儀器上建立的原模型進行預測。但是在實際應用中,一方面,用戶通常很難將標準樣本長期保存,環境的變化往往會造成樣本性質變化;另一方面,由于受物理空間影響,將標準樣本進行長途運輸亦顯得不具操作性。
中國海洋大學賀英于2012年在其博士論文中提出了一種新的模型傳遞方法——基于集成遷移學習的近紅外光譜模型傳遞方法,通過將遷移學習、樣本相似匹配和集成學習等方法相互結合,構建了具有一定穩健性的遷移模型。但是,該方法存在以下兩點不足:(1)該方法中分別利用支持向量機(Support Vector Machine,SVM)、K近鄰(K-NearNeighbor,KNN)和偏最小二乘(Partial Least Square,PLS)三種方法建立回歸模型,然后再進行加權集成,但是三種方法所建立的模型均是在同一樣本分布的前提下完成的,因此當待測樣本的分布與建模時所用的樣本分布不同時,則可能會出現“負遷移”現象;換句話說,當原模型的泛化性能(魯棒性)較差時,原模型的誤差也會傳遞到目標儀器上;(2)當目標儀器上的待測樣本分布發生變化時,如何根據待測樣本的局部結構,自適應地調整各個弱目標分析模型的權重。
因此,研究跨設備的模型傳遞方法,使得在某臺紅外光譜儀上已經建立好的分析模型能夠快速轉換到新的儀器上,具有重要的研究意義和應用價值。
發明內容
針對背景技術中存在的問題,本發明的目的是提供一種基于隨機森林遷移學習的紅外光譜模型傳遞方法,可以自適應地調整隨機森林中各個映射模型的權重因子,有效提升模型傳遞的準確度和穩定性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中北大學,未經中北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710037798.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于模型和模糊模式識別的氣路故障診斷方法
- 下一篇:機器學習方法和系統





