[發明專利]基于圖半監督支持向量機的工業過程大數據故障監測方法有效
| 申請號: | 201711222858.2 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN107976992B | 公開(公告)日: | 2020-01-21 |
| 發明(設計)人: | 張穎偉;詹晨光;方曉柯 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G05B23/02 | 分類號: | G05B23/02 |
| 代理公司: | 21109 沈陽東大知識產權代理有限公司 | 代理人: | 梁焱 |
| 地址: | 110169 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監督 支持 向量 工業 過程 數據 故障 監測 方法 | ||
1.一種基于圖半監督支持向量機的工業過程大數據故障監測方法,其特征在于:包括以下步驟:
步驟1:采集數據;通過電熔鎂爐現場安裝的攝像頭拍攝電熔鎂爐工作過程中的運行情況,獲取電熔鎂爐工作過程的圖片;記錄電流表顯示的各個電極的電流,同時加入拓展的電流變量,形成電流數據向量;
步驟2:對電熔鎂爐的圖像進行特征提取,形成圖像數據向量,并與電流數據向量統一;對統一后得到的數據進行PCA(Principal Component Analysis)降維處理,得到二維的數據集其中,x表示樣本數據點,y表示數據點的標記,l表示數據類型已標記的數據的數量,u表示數據類型未標記的數據的數量,n=l+u,表示數據集中數據的總數量;數據集中的數據類型的標記包括故障數據和正常數據;
步驟3:基于傳統的半監督支持向量機,構造目標函數,在數據集D中生成T個不同的大間隔低密度分界線
步驟4:從T個分界線中找出分類效果最好的分界線,來建立新的半監督支持向量機;通過求解新的半監督支持向量機,得到最優標記;根據最優標記對電熔鎂爐過程數據進行故障監測。
2.根據權利要求1所述的基于圖半監督支持向量機的工業過程大數據故障監測方法,其特征在于:所述步驟2中對電熔鎂爐的圖像提取的特征包括對比度、相關性、能量、同質性、熵和顏色直方圖。
3.根據權利要求1所述的基于圖半監督支持向量機的工業過程大數據故障監測方法,其特征在于:所述步驟3中構造的目標函數如式(1)所示,T個不同的分界線對應的未標記數據的標記為
其中,M是一個為了增大各分界線差別設置的常數;表示傳統的半監督支持向量機的目標函數,如式(2)所示;Ω是一個和分界線的差異性有關的變量,分界線互相之間的差別越大,Ω的值越小,具體如式(4)所示;
其中,ft表示T個大間隔低密度的分界線中的第t個分界線,表示第t個分界線ft對應的含有u個數據的未標記數據的標記向量;第一項為SVM(Support Vector Machine)的基本型;l(yif(xi))為損失函數;f(xi)表示核空間的數據點;C1和C2是用戶指定的用于平衡模型復雜度、有標記數據和未標記數據重要程度的折中參數,與數據點之間的距離Wii′相關,Wii′表示數據點xi與數據點xi′之間的距離,如式(3)所示;
其中,i、i′∈{1,2,...,n},σ>0是用戶指定的高斯函數帶寬參數,ne(xi)是數據點xi的k個鄰近的數據點;C10和C20是兩個權衡參數,分別表示標記數據和未標記數據對目標函數的影響;d表示所有數據點之間距離的總和,di表示樣本點xi周圍k個鄰近點之間的距離總和;
其中,δ是指示函數;t和為[1,T]內不同的值;是的轉置;表示第個分界線對應的含有u個數據的未標記數據的標記向量;是個常數。
4.根據權利要求3所述的基于圖半監督支持向量機的工業過程大數據故障監測方法,其特征在于:所述步驟4的具體方法為:
對于未標記數據樣本的標記y={yl+1,…,yl+u},將gain(y,y*,ysvm)和loss(y,y*,ysvm)分別作為與傳統的支持向量機SVM相比增加和減少的準確度;找到一個最合適的標記向量y來使數據標記的準確率相比支持向量機最大化,建立目標函數如式(5)所示;
其中,y*是未標記數據的真實標記數值,y*∈{±1},ysvm是支持向量機SVM對標記數據的預測標記;λ是權衡參數;
將相對于支持向量機實現最小改善的分界線進行最大化的改善,得到最優解如式(6)所示;
其中,是y的線性函數,其中
通過引入額外的變量τ,求最優解的內部的最優化目標函數轉變為最優化問題,則式(5)變為下式:
將其中的約束條件y∈{±1}u松弛為約束條件y∈[-1,1]u,則公式(7)變為凸線性問題,通過對這個凸線性問題進行求解,再還原為原問題的整數解;如果目標函數得到的整數解小于0,則將ysvm作為新的半監督支持向量機最終的輸出;否則,將得到的整數解作為新的半監督支持向量機最終的輸出;
引入變量α=[α1,...,αT]′≥0,根據拉普拉斯方程,得到
通過對上式求偏導等于0,即
在式(7)所示的目標函數中,將變量α引入,得到
其中,αt為能夠成為真實標簽的可能性;
通過標簽傳播的方法獲得α的值,根據得到的α和式(10)得到最優的標記,根據最優標記中正常數據和故障數據的分類實現故障監測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711222858.2/1.html,轉載請聲明來源鉆瓜專利網。





