[發明專利]基于批流統一數據聚類的風電機組異常檢測方法有效
| 申請號: | 202011519463.0 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112651617B | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 郭昆;戴錦坤;陳羽中;陳豪 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q10/00;G06Q50/06;G06F16/22;G06F16/2455;G06F16/2458;G06K9/62 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 陳明鑫;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 統一 數據 機組 異常 檢測 方法 | ||
本發明涉及基于批流統一聚類模式的風電機組異常數據檢測方法,將批量聚類和增量聚類結合。使用批量的聚類初始化方式,在首個時間窗口中初始化簇特征。后續窗口采用增量式的聚類方法,這樣能夠同時滿足批量聚類的高精度以及流式聚類的低延遲等特點,可以持續處理大規模持續流入的風電機組群運行數據,并能較快地反映出異常數據所在設備。加入了基于流式迭代的簇特征更新機制。引入迭代流的思想,將風電機組數據簇特征創建成迭代流。進行流式的數據狀態廣播、雙流連接計算,即將兩個流式數據進行連接后計算。根據數據的最近簇進行分區,窗口定時更新每個分區的簇特征并將其返回到迭代流中。本發明保證了實時流處理低延遲的特性。
技術領域
本發明涉及風電機組異常檢測領域,具體涉及一種基于批流統一數據聚類的風電機組異常檢測方法。
背景技術
風能是一種環境友好且經濟實用的可再生能源。中國是世界排名第一的風力發電國家、新裝風力發電設備裝機容量最大的國家,并且保持著持續的增長。因此,風電場數量和規模不斷擴大,然而受地理條件和環境因素限制,風電場多位于偏僻遙遠的平原、山區或海上,風電機組受設備、環境、運行狀態等因素影響,系統實時采集的風機運行數據會存在有大量異常值和缺失值,這些數據的存在嚴重影響后續的風電機組狀態分析、故障診斷等功能。因此,能夠實時并快速地識別并排除風電機組的異常數據具有重要的探究意義。
隨著計算機和物聯網設備的普及,各類網絡應用逐漸在泛化,由此產生了大量多源、異構的流式數據,包括大量保存在分布式文件系統的靜態數據以及海量具有時效性的實時數據源。聚類作為一種無監督學習方法,可以對相似的數據進行聚類,從而挖掘數據隱藏價值。但大多數聚類只能處理單一類型的數據,無法適用于多元化的批量和流式數據。所以,如何有效統一處理批量的靜態數據和實時的流式數據,如何實現滿足批量、增量、流式的統一聚類算法,也是聚類的一個發展方向。
批量聚類算法主要解決批量數據的聚類問題,它將數據全部獲取后再進行聚類分析。但由于內存大小、磁盤空間的限制,很多數據無法一次性獲取。這樣就出現了增量聚類算法,增量聚類算法能夠對后來的數據進行增量式的計算更新,解決了傳統聚類算法需要全量計算的缺陷。但隨著社會發展,大量數據不斷從網絡、傳感器以及網站點擊等場景實時產生,數據時效性成為大數據非常重要的標簽。為了適應實時產生的數據處理問題,出現了許多的流式聚類算法,典型代表包括基于層次的CluStream算法,基于網格密度的DenStream算法。流式聚類模型雖然設計了對流式數據快速處理的方法,但這無法有效的支持批量數據高精度的聚類分析。
發明內容
有鑒于此,本發明提供一種基于批流統一數據聚類的風電機組異常檢測方法,應用于風電機組運行過程中產生的異常數據的檢測,既能夠通過批處理保證結果的準確性,又能夠通過流式增量聚類來保證低延遲性。
為實現上述目的,本發明采用如下技術方案:
一種基于批流統一數據聚類的風電機組異常檢測方法,包括以下步驟:
步驟S1:獲取實時的風電機組數據,包括風電機運行時時間數據及傳感器的記錄數據;
步驟S2:將得到的風電機組數據劃分為滑動時間窗口,每次處理一個時間窗口中的數據;
步驟S3:根據劃分窗口預處理后的數據,初始化簇中心,提出融合了數據的批量處理和流式處理的批流統一聚類模型和簇特征更新機制,并在此基礎上設計批流統一的聚類算法,以得到風電機組數據的批量和流式聚類結果;
步驟S4:對聚類生成的每個簇的大小進行判斷,若簇內數據記錄數小于預設閾值,則判斷該簇為可能存在異常數據的簇,輸出簇內數據記錄,并將這些數據記錄對應的風電機標記為可能存在異常的風電機,輸出這些風電機的編號。
進一步的,所述風電機組批流數據為來自文件系統、消息隊列、網絡的多源數據,數據內容具體包括:數據記錄時間及傳感器記錄的風速(m/s)、功率(kW)、轉速(r/min)等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011519463.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于智能化紡織車間的吸塵器的功率智能控制方法
- 下一篇:一種多重檢測貼片機
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





