[發明專利]一種時間序列中不定長的異常子序列檢測方法在審
| 申請號: | 202110226782.0 | 申請日: | 2021-03-01 |
| 公開(公告)號: | CN112966017A | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 陳逸舟;張丹;熊曉菁 | 申請(專利權)人: | 北京青萌數海科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/28 |
| 代理公司: | 北京智沃律師事務所 11620 | 代理人: | 吳志宏 |
| 地址: | 100022 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 時間 序列 定長 異常 檢測 方法 | ||
1.一種時間序列中不定長的異常子序列檢測方法,包括以下步驟:
S1:輸入時間序列數據T,最小子序列長度min_len,最大子序列長度max_len,步長step;可選輸入近鄰個數k,k近鄰距離整合方法method,檢測異常子序列個數n_discords,并行進程數n_workers;
S2:根據設定的最小子序列長度min_len、最大子序列長度max_len以及步長step,確定目標子序列長度sub_len集合,針對集合中的每一個目標子序列長度sub_len,執行以下循環:
a)根據并行進程數n_workers,將時間序列T劃分為若干個時間序列子集Tworker;
b)在每一個進程中,應用STOMP算法,計算時間序列T中每一個子序列對于子集Tworker的局部近鄰矩陣mpworker;
c)將各個進程的計算結果mpworker進行整合,對于時間序列T中的每一個子序列,保留k個最近鄰的距離,并統計其中位數或均值,形成時間序列T在子序列長度sub_len上的k近鄰距離矩陣mpsub_len;
S3:從各個目標子序列長度sub_len的k近鄰距離矩陣mpsub_len中,計算得到k近鄰距離最大的n_discords個異常子序列;
S4:對于時間序列T中的每一個數據點ti,計算其在各個長度的異常子序列中出現的次數,將出現次數超過一定閾值的點標記為最終檢測的異常值。
2.根據權利要求1所述的時間序列中不定長的異常子序列檢測方法,其特征在于:步驟S1中,k默認為1,k近鄰距離整合方法method默認為中位數,檢測異常子序列個數n_discords默認為3,并行進程數n_workers默認為4。
3.根據權利要求1所述的時間序列中不定長的異常子序列檢測方法,其特征在于:步驟S1中,時間序列數據T應包括時間列和數值列,表示該序列在每一個時間點上對應的數值,且每個時間點之間最好是等間隔的;最小子序列長度min_len、最大子序列長度max_len和步長step用于確定子序列的長度范圍,即在大于等于min_len,小于等于max_len的范圍內,每隔step取一個值作為目標子序列長度,針對這里獲得的目標子序列長度集合,依次執行S2a-S2c的循環計算。
4.根據權利要求1所述的時間序列中不定長的異常子序列檢測方法,其特征在于:步驟S2中,首次進行異常檢測使用k=1,即最近鄰距離進行檢測,若發現結果中存在未能識別的相似異常模式,則增大k的值,通過k近鄰距離檢測異常。
5.根據權利要求3所述的時間序列中不定長的異常子序列檢測方法,其特征在于:步驟S2中,將時間序列T劃分為若干個時間序列子集Tworker時,在每一個并行進程中,輸入時間序列數據T、數據子集Tworker、目標子序列長度sub_len和近鄰個數k,初始化k近鄰距離矩陣matrix_profileworker,其行數為n-sub_len+1,列數為k,初始值均為正無窮。
6.根據權利要求5所述的時間序列中不定長的異常子序列檢測方法,其特征在于:步驟S2中,對于數據子集Tworker中的每一個子序列Ti,sub_len,應用STOMP算法,通過快速傅里葉變換和移動點積的方式計算子序列Ti,sub_len與時間序列數據T中每一條子序列的距離,得到長度為n-sub_len+1的距離向量disti,sub_len。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京青萌數海科技有限公司,未經北京青萌數海科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110226782.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種異常檢測方法
- 下一篇:富文本安全處理方法、裝置、電子設備和存儲介質





