[發(fā)明專利]一種基于增量PCA的工業(yè)監(jiān)測數(shù)據(jù)分類方法有效
| 申請?zhí)枺?/td> | 201811091469.5 | 申請日: | 2018-09-19 |
| 公開(公告)號: | CN109324595B | 公開(公告)日: | 2020-06-23 |
| 發(fā)明(設(shè)計)人: | 謝國;張永艷;劉涵;王文卿;梁莉莉;張春麗;孫瀾瀾 | 申請(專利權(quán))人: | 西安理工大學 |
| 主分類號: | G05B23/02 | 分類號: | G05B23/02 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 楊洲 |
| 地址: | 710048*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 增量 pca 工業(yè) 監(jiān)測 數(shù)據(jù) 分類 方法 | ||
本發(fā)明公開了一種基于增量PCA的工業(yè)監(jiān)測數(shù)據(jù)分類方法,包括如下步驟:步驟1、對工業(yè)監(jiān)測數(shù)據(jù)進行采集,按采樣順序排列,并記錄其數(shù)據(jù)標簽,將其分為訓練集和測試集;步驟2、基于增量PCA方法建立模型,分別對步驟1中的訓練集和測試集進行在線降維;步驟3、步驟2中的訓練集作為數(shù)據(jù)對象建立支持向量機SVM分類模型,并通過對測試集數(shù)據(jù)進行分類驗證該模型。本發(fā)明分別通過建立降維模型和傳統(tǒng)的SVM分類模型,可對有標簽的高維數(shù)據(jù)進行分類;該方法在保證計算量的同時,通過尋找最優(yōu)超平面,對線性數(shù)據(jù)和非線性數(shù)據(jù)都可以進行二分類;可將其用于工業(yè)系統(tǒng)的故障檢測,從而及時反映機器性能,能夠采取相應措施,避免一系安全事故。
技術(shù)領(lǐng)域
本發(fā)明屬于工業(yè)監(jiān)測數(shù)據(jù)分類的技術(shù)領(lǐng)域,具體涉及一種基于增量PCA的工業(yè)監(jiān)測數(shù)據(jù)分類方法。
背景技術(shù)
由于工業(yè)經(jīng)濟在我國的迅速發(fā)展,隨之產(chǎn)生的數(shù)據(jù)呈指數(shù)級增長。不可避免地,在大量的工業(yè)數(shù)據(jù)中會存在冗余數(shù)據(jù),這將給數(shù)據(jù)分析及后續(xù)計算帶來很大的困難。如果,可以對高維數(shù)據(jù)進行降維即數(shù)據(jù)壓縮,在對高維數(shù)據(jù)壓縮的同時對其提取有效信息,這將給數(shù)據(jù)分析帶來很大的便利。但是在現(xiàn)有降維方法中,主要針對的對象是離線數(shù)據(jù),而對于不斷更新的在線數(shù)據(jù),離線降維方法是無法對更新的監(jiān)測數(shù)據(jù)進行有效壓縮。
發(fā)明內(nèi)容
為解決上述問題,提出了一種基于增量PCA(Principal Component Analysis)的工業(yè)監(jiān)測數(shù)據(jù)分類方法。該方法可實時對有標簽的工業(yè)監(jiān)測數(shù)據(jù)進行有效分類,相對于未降維的高維數(shù)據(jù)減小了計算量,是一種有效的數(shù)據(jù)分類方法,且對于線性數(shù)據(jù)和非線性數(shù)據(jù)都適用。
本發(fā)明采用以下技術(shù)方案:一種基于增量PCA的工業(yè)監(jiān)測數(shù)據(jù)分類方法,包括如下步驟:
步驟1、對工業(yè)監(jiān)測數(shù)據(jù)進行采集,按采樣順序排列,并記錄其數(shù)據(jù)標簽,將其分為訓練集和測試集;
步驟2、基于增量PCA方法建立模型,分別對步驟1中的訓練集和測試集進行在線降維;
步驟3、步驟2中的訓練集作為數(shù)據(jù)對象建立支持向量機SVM分類模型,并通過對測試集數(shù)據(jù)進行分類驗證該模型。
作為本發(fā)明進一步的方案,所述步驟1具體包括如下步驟:
步驟1.1、對工業(yè)系統(tǒng)中的傳感器進行數(shù)據(jù)采樣,假設(shè)采樣數(shù)據(jù)為有標簽數(shù)據(jù),采集到的工業(yè)監(jiān)測高維數(shù)據(jù)用X={x1,x2,…,xN}∈Rd×N表示,其中d表示高維數(shù)據(jù)的維數(shù),每間隔1S進行一次采樣,N表示采樣數(shù)據(jù)的數(shù)目,第t個采樣數(shù)據(jù)用xt表示,t∈{1,2,...,N},xt=[xt1 xt2 … xtd]T;
步驟1.2、對采樣數(shù)據(jù)進行分配,采樣數(shù)據(jù)的標簽信息用Y={y1,y2,…,yN}∈R1×N表示,與高維數(shù)據(jù)X一一對應,選取高維數(shù)據(jù)X和數(shù)據(jù)標簽Y的前百分之八十作為訓練數(shù)據(jù)集和訓練標簽,剩下百分之二十作為測試數(shù)據(jù)集和測試標簽。
作為本發(fā)明進一步的方案,所述步驟2包括如下步驟:
步驟2.1、輸入高維數(shù)據(jù)X和所需參數(shù):離線降維目標維數(shù)k<d,在線降維目標維數(shù)l<k,w0=0;
步驟2.2、對矩陣U、矩陣Z以及各參數(shù)進行初始化:矩陣U和Z為U=0d×l,Z=0d×l,w=0,wU=0l×1;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學,未經(jīng)西安理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811091469.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





