[發明專利]基于時間序列的異常數據檢測方法、裝置、介質和設備有效
| 申請號: | 201911285902.3 | 申請日: | 2019-12-13 |
| 公開(公告)號: | CN111104736B | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 高嘉欣;胡文波;陳云天;田天 | 申請(專利權)人: | 北京瑞萊智慧科技有限公司 |
| 主分類號: | G06F30/20 | 分類號: | G06F30/20;G01D21/02 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 韓雪梅 |
| 地址: | 100086 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 時間 序列 異常 數據 檢測 方法 裝置 介質 設備 | ||
1.一種基于時間序列的異常數據檢測方法,其特征在于,所述方法包括:
獲取至少一個第一監測量的監測數據和第二監測量的監測數據,其中,所述第一監測量為監測對象的一個維度的環境量,所述第二監測量為監測對象的一個維度的物理量,所述第一監測量和所述第二監測量是監測對象的不同監測指標,所述第一監測量的監測數據和第二監測量的監測數據在時序上對應,且分別通過不同的傳感器在監測對象正常運行時采集得到;
基于特定的時序數據預測模型和至少一個所述第一監測量的監測數據得到對所述第二監測量的正常數據的預測,其中,所述時序數據預測模型包括至少一個擬合所述第一監測量和所述第二監測量的監測數據的特征信息的核函數;
若所述第二監測量的監測數據與預測出的所述正常數據不對應,則確定所述第二監測量的監測數據為異常數據。
2.如權利要求1所述的方法,其中,所述時序數據預測模型基于所述至少一個第一監測量的歷史監測數據和所述第二監測量的歷史監測數據訓練得到。
3.如權利要求1或2所述的方法,其中,所述時序數據預測模型采用多種核函數分別擬合所述數據的多個維度的特征信息。
4.如權利要求3所述的方法,其中,所述多種核函數包括徑向基核函數、正弦平方核函數、常數核函數、白噪聲核函數之中的至少兩項。
5.如權利要求4所述的方法,其中,所述數據的多個維度的特征信息至少包括以下之二:
數據的趨勢信息;
數據的周期信息;
數據的噪聲。
6.如權利要求5所述的方法,其中,所述時序數據預測模型在擬合所述數據的趨勢信息時,采用徑向基核函數;
在擬合所述數據的周期信息時,采用正弦平方核函數;
在擬合所述數據的噪聲時,采用白噪聲核函數。
7.如權利要求4-6任一所述的方法,其中,所述時序數據預測模型為高斯過程回歸模型。
8.如權利要求7所述的方法,其中,所述時序數據預測模型被設置為:
y=f(X)+Σ,且f(X)~GP[0,k(X,X’)] ,P(Σ)~N(Σ|0,σn2);
其中,y為表示第二監測量的預測數據的變量,X為表示第一監測量的監測數據的變量,Σ表示噪聲,k(X,X’)為核函數或多個核函數的組合,σn2為Σ的方差,n為X的維度。
9.如權利要求8所述的方法,其中,對所述第二監測量的預測至少包括預測值和預測區間。
10.如權利要求9所述的方法,其中,基于特定的時序數據預測模型和至少一個所述第一監測量的監測數據得到對所述第二監測量的預測值,具體包括:
將所述第一監測量的監測數據輸入至所述時序數據預測模型,得到所述時序數據預測模型輸出的所述第二監測量的預測分布,所述預測分布包含預測均值;
獲取所述預測均值作為所述第二監測量的預測值。
11.如權利要求9所述的方法,其中,基于特定的時序數據預測模型和至少一個所述第一監測量的監測數據得到對所述第二監測量的預測區間,具體包括:
將所述第一監測量的監測數據輸入至所述時序數據預測模型,得到所述時序數據預測模型輸出的所述第二監測量的預測分布,所述預測分布包含預測均值與預測方差;
獲取所述第二監測量的預設置信度;
根據所述預設置信度、預測均值以及預測方差確定所述第二監測量的預測區間。
12.如權利要求10或11所述的方法,其中,所述方法還包括:
統計預設時間段內第二監測量的異常數據總數;
若所述異常數據總數大于預設值,發送存在安全風險的提醒消息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京瑞萊智慧科技有限公司,未經北京瑞萊智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911285902.3/1.html,轉載請聲明來源鉆瓜專利網。





