[發明專利]基于模擬退火算法的近紅外光譜波長子區間選擇方法有效
| 申請號: | 201010123945.4 | 申請日: | 2010-03-12 |
| 公開(公告)號: | CN101807228A | 公開(公告)日: | 2010-08-18 |
| 發明(設計)人: | 鄒小波;石吉勇;趙杰文;殷曉平;陳正偉;黃星奕;蔡建榮;陳全勝 | 申請(專利權)人: | 江蘇大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G01N21/35 |
| 代理公司: | 南京知識律師事務所 32207 | 代理人: | 汪旭東 |
| 地址: | 212013 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模擬 退火 算法 紅外 光譜 波長 區間 選擇 方法 | ||
技術領域
本發明涉及一種對農產品或食品品質進行分析的近紅外光譜特征波長特征子區間選擇 方法,特指基于模擬退火算法的近紅外光譜波長特征子區間的選擇方法。
背景技術
目前,近紅外光譜技術在農產品、食品品質分析方面的運用越來越廣泛。但近紅外技 術本身也存在一定的不足,如背景復雜、信息強度低,譜峰重疊等,使得難以用常規的譜 圖解析方法解析近紅外光譜,如何有效的從大量近紅外光譜數據中提取特征信息成為了國 內外學者研究的重點。樣品在近紅外光譜的某個或者某幾個波段發生特征吸收,決定了高 信息量波數點鄰近的波數點也具有較高的信息量,即近紅外光譜數據具有一定的連續相關 性。根據近紅外光譜數據的這一特點,兼顧減少波長選擇算法計算量,提高算法效率等要 求,通常將近紅外全光譜分成若干個子區間,以區間為單位進行波長選擇。經典光譜區間 選擇算法有間隔偏最小二乘法,該算法是將全光譜分成若干個子區間,分別計算各個子區 間的交互驗證均方根誤差RMSECV(Root?Mean?Square?of?Cross?Validation),將交換驗證均 方根誤差最小的一個區間作為建模區間。間隔偏最小二乘算法的衍生算法有聯合區間偏最 小二乘法、向前/向后區間偏最小二乘算法、移動窗口偏最小二乘等,同經典區間偏最小二 乘算法相比,衍生算法不僅考察單一區間,還有幾個區間的聯合。這些算法雖然能提取光 譜的特征信息,但劃分子區間的過程具有一定的主觀性,同時,區間組合方式單一,不能 確保得到全局最優組合。
模擬退火算法(SAA)是一種適合解決大規模組合化問題,特別是NP完全類問題的 通用有效近似算法,具有描述簡單、使用靈活、運用廣泛、運行效率高和受初始解約束小 等有點。
發明內容
為了克服上述技術的不足,本發明提出一種基于模擬退火算法的食品、農產品近紅外 光譜波長特征子區間選擇方法,可客觀地劃分子區間,區間組合方式不單一,確保得到全 局最優組合。
本發明的技術方案是采用如下步驟:1)對近紅外光譜進行預處理,包括對校正集和預 測集樣本的劃分,將預處理后的近紅外光譜的全光譜劃分為k個子區間,若總波數點數除 以k等于n,存在余數m,則前m個子區間中每個子區間波數點個數為n+1,剩余子區間 中每個子區間波數點個數為n;2)設置最小子區間數Io、最大子區間數If、目標函數f(x)、 初始化溫度t0、溫度衰減函數g(α)、結束溫度tf、馬爾可夫鏈長度Lk和Metropolis接受新 解準則,采用模擬退火算法選擇最佳特征子區間的個數及組合方式,選擇完成后,遞增子 區間數,由子區間總數i=最小子區間數Io開始以i=i+1的方式遞增子區間數、直至i大于最 大子區間數If時遞增結束;3)重復執行模擬退火算法,在模擬退火算法結束時比較各種區 間劃分方式時的特征子區間最優組合,取目標函數值最大的優化解作為全局最優特征子區 間集合;4)根據全局最優特征子區間集合建立校正集與預測集模型;其特征是:所述模擬 退火算法的步驟包括:
(1)溫度為t=t0時,隨機選擇m個子區間作為舊解x;
(2)在舊解x和未選中的k-m個子區間中,根據子區間交換函數交換子區間后產生新 解y;子區間交換函數h(t)=1-exp(-t),當溫度t降低至tn-1時,溫度tn-1對應的子區間交換個 數cn-1=c*h(t),c是溫度為t時對應的子區間交換個數;
(3)計算新解y、舊解x的目標函數f(x)和f(y);
(4)根據(3)的計算結果,采用Metropolis接受新解準則判斷新解y、舊解x的重要 性;
(5)當溫度為t時,算法搜索迭代的次數,判斷算法搜索迭代的次數是否等于馬爾可 夫鏈長度Lk,如果不等于則重復步驟(2)~(5);否則執行下一個步驟(6);
(6)根據溫度衰減函數g(α)降低溫度t;
(7)判斷溫度t是否達到結束溫度tf,沒有達到結束溫度tf則重復執行(2)~(7), 否則執行步驟(8);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇大學,未經江蘇大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010123945.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





