[發明專利]基于類別分析法的近紅外光譜物質含量索引方法、設備及介質有效
| 申請號: | 201710380323.1 | 申請日: | 2017-05-25 |
| 公開(公告)號: | CN107122496B | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 劉彤;潘濤;曾永平;肖青青;沈鴻平;凌亞東 | 申請(專利權)人: | 廣州訊動網絡科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G01N21/359 |
| 代理公司: | 廣州市越秀區哲力專利商標事務所(普通合伙) 44288 | 代理人: | 蔡碧慧;鄧星文 |
| 地址: | 510630 廣東省廣州市天河區中*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 類別 分析 紅外 光譜 物質 含量 索引 方法 設備 介質 | ||
1.一種基于類別分析法的近紅外光譜物質含量索引方法,其特征在于包括以下步驟:
構建儀器畫像步驟:通過儀器畫像獲取特征信息,并將所述特征信息劃分多個標簽,獲取每個標簽的標簽權重;
含量索引步驟:通過類別分析法創建含量索引表,得到成分含量的分類模型,并根據成分含量的分類模型以及對應的標簽權重得到物質成分含量的含量預測值;
梯度預測步驟:根據所述含量預測值建立梯度預測值,推送給用戶。
2.如權利要求1所述基于類別分析法的近紅外光譜物質含量索引方法,其特征在于:所述構建儀器畫像步驟包括以下步驟:
步驟11、針對樣品中某一種成分的含量,從樣品中選取n個樣本,并選取m臺儀器;
步驟12、通過理化檢測獲取所述n個樣本中該種樣品的成分含量,分別記作:y1、y2、…、yn;
步驟13、使用每臺儀器對每個樣本進行光譜掃描,得到t個標簽,每個標簽包括n*m個值;
步驟14、對于第1個標簽,將掃描每個樣本時的特征值作為因變量,將成分含量作為自變量,通過隨機方式對數據進行第一訓練集和第一測試集的劃分;
步驟15、基于第一訓練集,使用最小二乘法建立回歸模型,使用所述回歸模型對第一測試集中的特征值進行計算得到預測的成分含量值;
步驟16、將第一測試集中的預測的成分含量值與對應的真實成分含量進行比較,求出預測標準偏差SEP;
步驟17、重復步驟14-16,直至所有的標簽對應的預測標準偏差都計算完畢,計算得到的預測標準偏差SEP分別記作s1、s2、…、st;
步驟18、通過步驟12計算得到該種樣品的成分含量均值y0=(y1+y2+…+yn)/n;
步驟19、結合步驟17和步驟18得到每個標簽的標簽權重,每個標簽的標簽權重分別記作w1、w2、…、wt,其中:
,,…,;
步驟110、根據所述標簽權重生成該種成分含量的權重向量(w1,w2,…,wt)。
3.如權利要求2所述基于類別分析法的近紅外光譜物質含量索引方法,其特征在于:所述含量索引步驟包括以下步驟:
步驟21、依據樣品的不同條件將樣品分為不同類別;所述樣品的不同條件包括樣品的品種、生長環境、產地、收集時間、供應商、處理方式;
步驟22、對步驟21中所分的第一類別,以儀器畫像中的t個標簽作為用于含量索引的一系列屬性值(a1,a2,…,an),以樣品的成分含量作為索引結果的記錄值,即所述記錄值為y1、y2、…、yn;
步驟23、以步驟22中t個系列屬性值(a1,a2,…,an)*t作為自變量,記錄值(y1,y2,…,yn)作為因變量,并通過隨機的方式對數據進行第二訓練集和第二測試集的劃分;
步驟24、對于第一個系列屬性值,基于第二訓練集,建立四種分類模型,該四種分類模型對應的算法分別為K-最鄰近法、邏輯回歸分類法、支持向量機分類法、隨機森林分類法;
步驟25、將這四種算法所創立的分類模型對第二測試集進行類別預測,并計算分類準確率RATE1,RATE2,RATE3,RATE4=預測類別正確個數/訓練集記錄數*100%;
步驟26、重復步驟24-25,直至所有t個標簽的分類準確率RATE((r1,r2,r3,r4)*t)均計算完畢,定義第一個標簽的分類準確率為r11、r21、r31和r41;第二個標簽的分類準確率為r12、r22、r32和r42,定義第i個標簽的分類準確率為r1i、r2i、r3i和r4i,第t個標簽的分類準確率為r1t、r2t、r3t和r4t;
步驟27、通過使用儀器畫像中的權重向量,求出準確率最高Rmax的分類算法,并將通過準確率最高Rmax的分類算法創建的分類模型作為第一種類別所對應最優的樣品成分含量的分類模型;其中:
Sum([r11,r12,…,r1t]*(w1,w2,…,wt))=R1;
Sum([r21,r22,…,r2t]*(w1,w2,…,wt))=R2;
Sum([r31,r32,…,r3t]*(w1,w2,…,wt))=R3;
Sum([r41,r42,…,r4t]*(w1,w2,…,wt))=R4;
Rmax=Max(R1,R2,R3,R4);
步驟28、重復步驟22-27,直至求得每個類別所對應最優的樣品成分含量的分類模型(CRmax1,CRmax2,CRmax3,…,CRmaxt)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州訊動網絡科技有限公司,未經廣州訊動網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710380323.1/1.html,轉載請聲明來源鉆瓜專利網。





