[發明專利]基于自適應模糊聚類的熱電工業數據異常檢測方法及系統有效
| 申請號: | 201910768987.4 | 申請日: | 2019-08-20 |
| 公開(公告)號: | CN110472690B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 杜韜;弭濤;曲守寧;李國昌;李沁璐;沈天宇 | 申請(專利權)人: | 濟南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G07C3/00 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張慶騫 |
| 地址: | 250022 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自適應 模糊 熱電 工業 數據 異常 檢測 方法 系統 | ||
本公開提供一種基于自適應模糊聚類的熱電工業數據異常檢測方法及系統。其中,熱電工業數據異常檢測方法包括實時獲取d維度的熱電工業數據作為樣本,按照時間順序存儲至數據集S;將數據集S所分布空間的每一維劃均分為相等的m個間隔段,生成不相交的網格;將數據集S中的映射到網格中計算各個網格的重心,作為新的數據點來代表相應網格內所包含的熱電工業數據,形成網格重心數據集;利用自適應模糊聚類算對網格重心數據集P進行聚類,得到所有聚類中心;計算網格重心數據集中每個數據點所對應網格包含的熱電工業數據與其最鄰近的聚類中心的距離并與預設距離閾值比較,進而判斷熱電工業數據是否異常。
技術領域
本公開屬于熱電工業數據異常檢測領域,尤其涉及一種基于自適應模糊聚類的熱電工業數據異常檢測方法及系統。
背景技術
本部分的陳述僅僅是提供了與本公開相關的背景技術信息,不必然構成在先技術。
數據是智能時代這一饕餮盛宴的原生材料,巨量的數據蘊含著豐富的信息和知識。要想從這些數據中提取信息投入到實際應用中,首先就要對其進行聚類分析,聚類是一種有用的數據分析工具。它是一種查找同一集群中相似度最高的數據組和不同集群之間不同的數據組的方法。
熱電工業數據是指的熱電廠在生產過程中產生的數據,比如預測的生產狀態參數有氣包壓力,主汽溫度,料層溫度,返料溫度,煙氣含氧量,爐膛差壓,料層差壓等。由于熱電工業數據變化快,差別大,很難用硬聚類進行劃分。
發明人發現,通常的模糊聚類會受到初始化和參數選擇的影響,需要預先給定許多集群。但是熱電工業數據隨機性和數據量都十分龐大,無法預測,所以用通常的方法很難對熱電工業數據進行聚類處理,進而影響熱電工業數據異常檢測的準確性及效率。
發明內容
為了解決上述問題,本公開的第一個方面提供一種基于自適應模糊聚類的熱電工業數據異常檢測方法,其能夠在聚類簇數未知情況下參數自適應時,對于巨量數據進行聚類,從而提高熱電工業數據異常檢測的準確性及效率。
為了實現上述目的,本公開采用如下技術方案:
一種基于自適應模糊聚類的熱電工業數據異常檢測方法,包括:
實時獲取d維度的熱電工業數據作為樣本,按照時間順序存儲至數據集S;
將數據集S所分布空間的每一維劃均分為相等的m個間隔段,生成不相交的網格;其中Ds為數據集S的標準化離散度;N為數據集S中樣本數量;
將數據集S中的映射到網格中計算各個網格的重心,作為新的數據點來代表相應網格內所包含的熱電工業數據,形成網格重心數據集;
利用自適應模糊聚類算對網格重心數據集P進行聚類,得到所有聚類中心;
計算網格重心數據集中每個數據點所對應網格包含的熱電工業數據與其最鄰近的聚類中心的距離并與預設距離閾值比較,進而判斷熱電工業數據是否異常。
為了解決上述問題,本公開的第二個方面提供一種基于自適應模糊聚類的熱電工業數據異常檢測系統,其能夠在聚類簇數未知情況下參數自適應時,對于巨量數據進行聚類,從而提高熱電工業數據異常檢測的準確性及效率。
為了實現上述目的,本公開采用如下技術方案:
一種基于自適應模糊聚類的熱電工業數據異常檢測系統,包括:
數據獲取模塊,其用于實時獲取d維度的熱電工業數據作為樣本,按照時間順序存儲至數據集S;
網格劃分模塊,其用于將數據集S所分布空間的每一維劃均分為相等的m 個間隔段,生成不相交的網格;其中Ds為數據集S的標準化離散度;N為數據集S中樣本數量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南大學,未經濟南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910768987.4/2.html,轉載請聲明來源鉆瓜專利網。





