[發明專利]一種基于增量PCA的工業監測數據分類方法有效
| 申請號: | 201811091469.5 | 申請日: | 2018-09-19 |
| 公開(公告)號: | CN109324595B | 公開(公告)日: | 2020-06-23 |
| 發明(設計)人: | 謝國;張永艷;劉涵;王文卿;梁莉莉;張春麗;孫瀾瀾 | 申請(專利權)人: | 西安理工大學 |
| 主分類號: | G05B23/02 | 分類號: | G05B23/02 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 楊洲 |
| 地址: | 710048*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 增量 pca 工業 監測 數據 分類 方法 | ||
1.一種基于增量PCA的工業監測數據分類方法,其特征在于,包括如下步驟:
步驟1、對工業監測數據進行采集,按采樣順序排列,并記錄其數據標簽,將其分為訓練集和測試集;
步驟2、基于增量PCA方法建立模型,分別對步驟1中的訓練集和測試集進行在線降維;
步驟3、步驟2中的訓練集作為數據對象建立支持向量機SVM分類模型,并通過對測試集數據進行分類驗證該模型;
所述步驟1具體包括如下步驟:
步驟1.1、對工業系統中的傳感器進行數據采樣,假設采樣數據為有標簽數據,采集到的工業監測高維數據用X={x1,x2,…,xN}∈Rd×N表示,其中d表示高維數據的維數,每間隔1S進行一次采樣,N表示采樣數據的數目,第t個采樣數據用xt表示,t∈{1,2,...,N},xt=[xt1xt2...xtd]T;
步驟1.2、對采樣數據進行分配,采樣數據的標簽信息用Y={y1,y2,...,yN}∈R1×N表示,與高維數據X一一對應,選取高維數據X和數據標簽Y的前百分之八十作為訓練數據集和訓練標簽,剩下百分之二十作為測試數據集和測試標簽;
所述步驟2包括如下步驟:
步驟2.1、輸入高維數據X和所需參數:離線降維目標維數k<d,在線降維目標維數l<k,w0=0;
步驟2.2、對矩陣U、矩陣Z以及各參數進行初始化:矩陣U和Z為U=0d×l,Z=0d×l,w=0,wU=0l×1;
步驟2.3、進入for循環:當接收到第t個采樣數據xt時,對參數w、殘差rt和矩陣C進行更新,更新公式如下所示,而對于每個采樣數據xt,其低維用st表示:
rt=xt-U*UT*xt;
C=(I-U*UT)*Z*ZT*(I-U*UT);
步驟2.4、對初始矩陣和參數進行設置,判斷是否更新矩陣C和向量rt,具體包括以下步驟:
步驟2.4.1、對初始矩陣和參數進行設置后,判斷是否滿足條件式在滿足該條件的情況下,按順序執行步驟2.4.2-步驟2.4.3,反之,執行步驟2.5;
步驟2.4.2、先對矩陣C進行特征值分解,其最大特征值和其相對應的特征向量分別用λ、u表示,并將特征值λ賦給(wU)u;
步驟2.4.3、判斷U中是否有非零列,如果有,用特征向量u代替U的第一個非0列,更新矩陣C和向量rt,更新公式如下:
C=(I-U*UT)*Z*ZT*(I-U*UT);
rt=xt-U*UT*xt;
步驟2.5、由于rt的更新,矩陣Z會隨之更新,具體更新過程如下;
步驟2.5.1、先對矩陣Z進行轉置,矩陣Z的第l行用Zl表示,并用rt替換矩陣Z的第l行Zl,其它行元素不變;
步驟2.5.2、再對矩陣Z進行SVD分解,即[U1,Σ1,V1]←SVD(Z),Σ1為奇異矩陣,其中的奇異值從大到小排列;
步驟2.5.3、按照公式C1=Σ1V1和進行運算,其中Σl,l表示奇異值矩陣中最小的奇異值;
步驟2.5.4、按照公式進行計算,其中Σ2表示對奇異值矩陣中的所有奇異值和零元素進行平方運算,矩陣規模大小不變;
步驟2.5.5、輸出更新后的矩陣Z:再次對Z進行轉置;
步驟2.6、低維輸出:對于矩陣U中每一個非零列u,其元素按公式(wU)u=(wU)u+xt,u2更新,(wU)u為向量wU在u方向上的投影,并進行低維輸出st=UT*xt,并結束for循環;
所述步驟3包括如下步驟:
步驟2中將高維數據進行降維,降維之后用S={s1,s2,…,sN}表示,其中st為l維向量,t=1,2,…,N,在步驟3中,將降維后的數據S采樣個數的前百分之八十作為訓練集的輸入數據,其對應的標簽作為訓練標簽,代入傳統的支持向量機SVM模型并進行訓練,剩下百分之二十作為測試數據集,輸入訓練完成的SVM模型,其輸出是測試數據集的標簽,并將真實數據標簽與測試數據集的標簽進行比較,從而可以判斷該模型是否有效;
步驟3.1、將訓練數據作為輸入,訓練標簽作為輸出,訓練分類模型,根據方程|wx+b|=1建立兩邊支持向量,該算法在訓練過程中需要滿足支持向量間距離盡可能大,這樣可以對采樣數據實現有效分類;
步驟3.2、根據方程wx+b=0在兩支持向量中間尋找最優超平面,最優超平面可以保證將不同類別的采樣數據通過最優超平面分類;
步驟3.3、如果采樣數據線性不可分,則通過選取核函數將采樣數據映射到更高維的特征空間中,這樣在高維空間中映射的采樣數據就可以滿足線性可分;
步驟3.4、模型訓練完成后通過計算得到最優的w和b,即最優超平面,將測試數據集代入,并輸出其測試標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安理工大學,未經西安理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811091469.5/1.html,轉載請聲明來源鉆瓜專利網。





