[發明專利]一種基于機器學習的工業數據質量評測方法及評測系統在審
| 申請號: | 202011498693.3 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112463838A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 樊樹盛;賀本彪;苗維杰 | 申請(專利權)人: | 杭州立思辰安科科技有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F16/28;G06Q10/06;G06N20/00 |
| 代理公司: | 北京中濟緯天專利代理有限公司 11429 | 代理人: | 張瑩 |
| 地址: | 310051 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 工業 數據 質量 評測 方法 系統 | ||
本發明公開了一種基于機器學習的工業數據質量評測方法及評測系統,其中,評測方法包括以下步驟:S1:對檢測數據進行預處理以排除單個檢測數據點的異常數據;S2:構建關聯模型,并對預處理后符合要求的檢測數據進行判斷以確定不符合相互關聯的異常檢測數據。本發明通過預處理過程對明顯不符合要求的異常數據進行識別,然后通過關聯模型對在相關組內不相互關聯的異常數據進行識別,能夠方便的實現對工業生產過程中的多個區域的數據進行檢測,并且能準確的確定異常監測數據。
技術領域
本發明涉及工業信息技術領域,特別是一種基于機器學習的工業數據質量評測方法。
背景技術
工業生產過程中需要對多個區域的數據進行檢測,并根據檢測結果確定相關的生產過程中設備的穩定性,但是隨著檢測傳感器的數量的不斷增加,如何有效的判斷出獲得的檢測數據的準確性,對檢測數據進行評估以找出異常數據至關重要。
現有技術中多采用直接比對方式獲取,在數據量少的時候能夠很好的對數據進行判斷但是隨著數據量的不斷增多,采用傳統的方式進行工業數據質量評測則很難進行。
此外,現有技術中常規方式是針對不同的工業作業具體需求和數據類型,建立不同的數據監控和質量評估模型,缺乏一種統一的無需區分作業環境、傳感器數據類型的數據質量測評方法。
因此,有必要提出一種具有通用意義的基于機器學習的工業數據質量評測方法。
發明內容
本發明的目的是提供一種基于機器學習的工業數據質量評測方法,以解決現有技術中的不足,它能夠方便的實現對工業生產過程中的多個區域的數據進行檢測,并且能準確的確定異常監測數據。
本發明提供了一種基于機器學習的工業數據質量評測方法,包括以下步驟:
S1:對檢測數據進行預處理以排除單個檢測數據點的異常數據;
S2:構建關聯模型,并對預處理后符合要求的檢測數據進行判斷以確定不符合相互關聯的異常檢測數據。
如上所述的一種基于機器學習的工業數據質量評測方法,其中,可選的是,步驟S1可以包括:
S11:構建歷史單元評估模型;
S12:通過歷史單元數據評估模型構建標準測點屬性數據庫,并確立標準值區間和標準數值變化幅度區間;
S13:獲取當前檢測數據屬性,并與標準測點屬性數據庫比對,在當前檢測數據超出標準區間時判斷為超出值域檢測數據;在當前檢測數據超出變化幅度區間時判斷為幅度波動異常檢測數據。
如上所述的一種基于機器學習的工業數據質量評測方法,其中,可選的是,步驟S11可以包括:
S111:獲取一定時間內的歷史檢測數據X1、X2、X3......Xi........Xn;
S112:計算所有歷史檢測數據的中位數median(X);
S113:計算每個歷史觀測數據與中位數的絕對偏差值|Xi-median(X)|;
S114:計算絕對偏差值的中位數MAD=median(|Xi-median(X)|);
S115:將每個歷史觀測數據的絕對偏差值除以MAD以得到基于MAD的所有觀測數據的離中心的距離值Xm。
如上所述的一種基于機器學習的工業數據質量評測方法,其中,可選的是,步驟S12可以包括:
根據Three-Sigma Rule公式Pr(μ-3σ≤Xm≤μ+3σ)≈0.9973確立Xm符合要求的標準值區間和標準數值變化幅度區間;其中,σ代表標準差,μ代表均值;不符合要求的異常數據的Xm取值大于μ+3σ或小于μ-3σ。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州立思辰安科科技有限公司,未經杭州立思辰安科科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011498693.3/2.html,轉載請聲明來源鉆瓜專利網。





