[發明專利]一種用于過程參數在線檢測的增量集成算法在審
| 申請號: | 201410695786.3 | 申請日: | 2014-11-24 |
| 公開(公告)號: | CN104462797A | 公開(公告)日: | 2015-03-25 |
| 發明(設計)人: | 田慧欣 | 申請(專利權)人: | 天津工業大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300160*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 過程 參數 在線 檢測 增量 集成 算法 | ||
技術領域
本發明屬于在線檢測技術領域,具體涉及一種基于數據的智能增量集成檢測方法。
背景技術
近年來,人工智能技術得到了飛速的發展,基于人工智能技術的各種軟測量方法在工業生產過程中也得到了廣泛的應用。然而,在實際應用過程中基于單一智能算法的軟測量方法常常存在著泛化能力有限、容易出現過擬合等不足,造成軟測量模型的精度難以提高,嚴重制約了軟測量技術在生產過程中的實際運用。集成學習可以將多個子學習機進行融合,進而提高整個學習系統的性能,能夠在很大程度上克服上述不足。目前,集成學習已經成為國內外機器學習界的研究熱點,但是大多數的研究都是針對分類問題進行的,如研究最為廣泛的Bagging和Boosting算法等,對于集成學習在回歸問題上的研究則少之又少。此外,在實際生產過程中需要軟測量模型能夠隨著生產的進行不斷進行更新,以確保其測量精度,這種在線更新能力的優劣直接決定了軟測量技術實際應用的有效性。傳統的更新方法常通過不斷增加訓練數據來對模型進行更新,使得模型的訓練時間不斷增加,若直接減掉部分數據則造成信息缺失;或者更新方法只適用于某一類模型,不具有應用的廣泛性。軟測量模型更新已經成為阻礙軟測量實際應用的最大絆腳石。因此開發能夠使軟測量模型具有不斷學習新數據的能力,同時能夠保存從舊數據中學習到的信息,不會遺忘舊知識,具有在線學習效率高、節省訓練時間、所需存儲空間小的軟測量建模方法,成為保障軟測量在實際生產過程中在線應用所迫切需要開發的技術。
目前,用于集成軟測量最為廣泛的方法為Boosting集成算法,Boosting是一種典型的基于重抽樣技術的集成方法,其核心思想是在訓練新的學習機時,更關注那些學習效果較差的訓練樣本。Freund和Schapire將Schapire提出的自適應Boosting算法(AdaBoost)進行擴展,提出了AdaBoost.M1算法和AdaBoost.M2算法,它們可以有效地解決多分類問題。如何用Boosting集成思想來解決回歸問題已經成為各國學者關注的問題,Freund和Schapire將AdaBoost.M2延伸到回歸問題中,提出了AdaBoost.R集成算法,該算法的核心是以映射的形式將回歸數據轉化為分類數據集,進而達到解決回歸問題的目的,并通過實驗對其進行了驗證,然而仍然存在著不足。針對AdaBoost.R集成算法的不足,Drucker對AdaBoost.R進行改進,提出了AdaBoost.R2算法,并通過實驗驗證了其對于回歸問題的適用性。AdaBoost.R2實際上也是AdaBoost.M2在回歸問題上的延伸,首先選擇一種回歸方法作為基本弱學習機,然后根據樣本每次訓練的誤差大小來修改該樣本所對應的權重,使用新的權重選擇訓練樣本來訓練弱學習機,反復上述過程直到滿足終止條件,最后將訓練好的弱學習機通過一定模式進行集成,得到最終的集成結果。然而,AdaBoost.R2有著與AdaBoost.M1同樣的缺點:當誤差率大于0.5時則不能繼續對弱學習機進行訓練。2001年Polikar和Udpa結合AdaBoost思想提出了一種增量集成學習算法——Learn++算法,用于解決多分類問題。Learn++算法具有增量學習的性能,能夠從新數據中學習到新的信息,同時不會遺忘從舊數據中學到的信息。對于已有的類不需要使用原始數據對其訓練,并能夠通過對新數據的學習增加新的類。Learn++集成算法在分類問題上已有一定應用,但此類增量學習的方法在解決回歸問題上的研究仍然處于空白。
本發明的支持基金為國家自然科學基金(61403277)。
發明內容
本發明的目的在于針對過程參數在線軟測量技術的不足,提供一種基于數據的智能增量集成檢測方法。該方法提供一種集成算法,能夠提高傳統軟測量方法的檢測精度,并在集成過程中加入權重,通過對權重的更新賦予模型增量學習的性能,從而實現在線實時檢測。
本發明的用于過程參數在線檢測的增量集成算法具體步驟如下:
(1)測量并記錄一定數量與被檢測量相關的可測量和被檢測量,并從得到的數據集中隨機抽取M個子數據集。選擇一種基本智能算法作為弱學習機,并確定弱學習機的個數L,確定基準誤差ε。
(2)對于每一個子數據集進行以下操作:賦予每個樣本一個權重,并根據權重選取相應的訓練子集與測試子集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津工業大學,未經天津工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410695786.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種終端
- 下一篇:一種幼兒成長記錄裝置
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





