[發明專利]基于近紅外光譜相似度的模型界外樣本識別方法有效
| 申請號: | 201711470844.2 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108226092B | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 劉彤;向軼;許定周;曾永平;肖青青;凌亞東 | 申請(專利權)人: | 廣州訊動網絡科技有限公司 |
| 主分類號: | G01N21/359 | 分類號: | G01N21/359 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 劉巧霞 |
| 地址: | 510630 廣東省廣州市天*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 紅外 光譜 相似 模型 界外 樣本 識別 方法 | ||
本發明公開了一種基于近紅外光譜相似度的模型界外樣本識別方法,包括步驟:(1)在建模階段,先計算校正集中所有樣品的平均光譜;然后計算校正集中每條光譜與平均光譜之間的相似度;對求得的相似度進行排序,忽略相似度最小的M個值,確定未被忽略的光譜中最小相似度simmin,設定一閾值lim=simmin*P;(2)在檢測階段,首先計算待測樣本的光譜與平均光譜之間的相似度sim′;然后將sim′與lim進行比較,如果sim′≤lim*X,X為一預設閾值,則判定當前樣本為模型界外樣本,否則,判定當前樣本為模型界內樣本。本發明計算簡單,時耗低,所需存儲的數據量較少,實用性高。
技術領域
本發明涉及近紅外光譜分析研究領域,特別涉及一種基于近紅外光譜相似度的模型界外樣本識別方法。
背景技術
近紅外光譜分析中的定量分析大都是采用同一種模式,即基于一組已知樣品建立校正模型。這一組已知樣品稱為校正集樣品或訓練集樣品,通過這組樣品的光譜及其對應基礎數據(理化數據),利用多元矯正或模式識別方法建立校正模型。對于待測樣品,只需測定其光譜,根據已建的模型便可快速給出定量結果。
然而,若待測樣本與建立校正模型的已知樣本相關性過低,則使用該校正模型得出的預測結果不具有可信度。預測過程界外樣本的識別主要是用來檢驗待測樣本是否在所建校正模型的覆蓋范圍內,以確保對其預測結果的準確性。
根據ASTM E-1655,目前模型界外樣本的識別方法主要包括三類:一是濃度界外樣本,即使用馬氏距離檢測未知樣本的濃度是否超出了校正樣本的濃度范圍;二是光譜殘差界外樣本,即使用光譜殘差均方根(RMSSR)檢測未知樣本是否含有校正集樣本不存在的組分;三是最鄰近距離界外樣本,即使用最鄰近距離檢測未知樣本是否位于校正集樣本分布稀疏的區域。當未知樣本的光譜殘差、馬氏距離和最鄰近距離中有任何一項超出相應閾值時,則說明該樣本為模型界外樣本,其預測結果的準確性將受到較大質疑。
發明內容
本發明的目的在于克服現有技術的缺點與不足,提供一種基于近紅外光譜相似度的模型界外樣本識別方法,該方法計算簡單,時耗低,所需存儲的數據量較少,實用性高。
本發明的目的通過以下的技術方案實現:基于近紅外光譜相似度的模型界外樣本識別方法,包括步驟:
(1)在建模階段,先計算校正集中所有樣品的平均光譜;
然后計算校正集中每條光譜與平均光譜之間的相似度;
對求得的相似度進行排序,忽略相似度最小的M個值,確定未被忽略的光譜中最小相似度simmin,設定一閾值lim=simmin*P,P是一參數;
(2)在檢測階段,首先計算待測樣本的光譜與平均光譜之間的相似度sim′;
然后將sim′與lim進行比較,如果sim′≤lim*X,X為一預設閾值,則判定當前樣本為模型界外樣本,否則,判定當前樣本為模型界內樣本。
優選的,步驟(1)中,校正集中每條光譜與平均光譜之間的相似度計算公式如下:
其中,U為特征集,u為U內單個特征緯度所代表的信息,i代表每個待對比樣品光譜的特征集合,x代表平均光譜的特征集合,代表該特征緯度上待對比樣品光譜與平均光譜的均值,sim代表待對比樣品光譜的特征集合與平均光譜特征集合的比對結果,即相似度。
優選的,步驟(1)中,M=N*Q,其中N為校正集樣品數,若N*Q1,則M取1;若N*Q≥1,則M取整,Q范圍為0.001至0.05。采用該閾值,可以較準確的實現后續樣本的劃分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州訊動網絡科技有限公司,未經廣州訊動網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711470844.2/2.html,轉載請聲明來源鉆瓜專利網。





