[發明專利]基于深度字典的多傳感器數據漂移檢測方法有效
| 申請號: | 202210342799.7 | 申請日: | 2022-04-02 |
| 公開(公告)號: | CN114897047B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 鮑軍鵬;胡偉;張震;王魁;張南;唐斌;汪建基;高宇飛;李國靖;王文青 | 申請(專利權)人: | 西安交通大學;中國人民解放軍63919部隊 |
| 主分類號: | G06F18/24 | 分類號: | G06F18/24;G06F18/28;G06F18/10;G06F18/214 |
| 代理公司: | 北京中南長風知識產權代理事務所(普通合伙) 11674 | 代理人: | 鄭海 |
| 地址: | 710103 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 字典 傳感器 數據 漂移 檢測 方法 | ||
本發明涉及一種基于深度字典的多傳感器數據漂移檢測方法,包括:數據預處理:采用滑動窗口方法將原始輸入的多變量時間序列數據劃分成多個子序列,每個子序列代表一個樣本,將劃分后的數據分為訓練數據集和測試數據集;深度字典學習:包括稀疏編碼和信號解碼;異常檢測:通過在訓練集上學習到的字典計算待測試樣本的稀疏編碼,然后將字典和測試樣本的稀疏編碼進行相乘得到測試樣本的重構數據,重構誤差為異常得分,如果異常得分大于閾值,則判為異常,否則為正常。本發明不需要十分大量的標注數據。采用自動閾值的方法,根據樣本的歷史重構誤差生成一個自動閾值,將自動閾值與當前測試樣本的重構誤差進行比較,具有較高的穩定性和泛化能力。
技術領域
本發明涉及智能信息處理和計算機技術領域,尤其涉及一種基于深度字典的多傳感器數據漂移檢測方法。
背景技術
航天器多個傳感器數據存在漂移現象,正常情況下一組相關的傳感器有各自的正常規律曲線,從而可以學習出正常數據對應的字典。但是傳感器會因為太空環境變化或者自身問題等原因產生數據漂移(即傳感器輸出的數據不準確,不符合原先的正常值趨勢規律)。所以,需要一種檢測方法判定多個傳感器的輸出是否有異常,是否發生了漂移。
發明內容
本發明的目的是一種基于深度字典的多傳感器數據漂移檢測方法,針對多傳感器時序數據維度間關系復雜、缺乏異常標注的情況,采用半監督方式對正常數據進行學習,提取正常數據對應的字典和稀疏編碼,不僅縮小時間開銷而且深度字典能夠很好的學習數據特征;相對于現有弱監督檢測模型中異常分數閾值導致模型泛化能力弱的問題,本發明采用一種自動閾值的方法,從而提高該異常檢測方法在不同數據上的泛化能力。
本發明提供了一種基于深度字典的多傳感器數據漂移檢測方法,包括:
1)數據預處理
采用滑動窗口方法將原始輸入的多變量時間序列數據劃分成多個子序列,每個子序列代表一個樣本,將劃分后的數據分為訓練數據集和測試數據集;其中,訓練數據集只包含正常樣本;
2)深度字典學習
包括稀疏編碼和信號解碼;所述稀疏編碼通過FISTA快速迭代收縮閾值算法在給定的字典上求解輸入信號對應的稀疏表示;所述信號解碼將字典和學到的稀疏表示進行相乘以得到信號的重構結果;將原始信號和重構信號的均方誤差作為損失函數,并通過最小化損失函數對字典進行更新;
3)異常檢測
通過在訓練集上學習到的字典H計算待測試樣本的稀疏編碼,然后將字典和測試樣本的稀疏編碼進行相乘得到測試樣本的重構數據,重構誤差為異常得分,如果異常得分大于閾值,則判為異常,否則為正常。
進一步地,所述數據預處理包括:
采用滑動窗口方法對原始數據進行劃分,對于多變量時間序列集X={X1,X2,X3,…Xn},其中Xi=[xi1,xi2,xi3,…xim],xij∈R,xij為時間序列中第i個時間點的第j個屬性的觀測對象的值,n為該時間序列的長度,m為觀測對象的屬性維度,使用窗口大小為L,滑動步長為S的滑動窗口將該時間序列進行分割成一組長度相等的時間序列的子序列X={S1,S2,S3,…SM},即:
式中:M表示子序列的個數,L表示每個子序列的長度,每個子序列為模型訓練中的一個樣本。
進一步地,所述稀疏編碼包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學;中國人民解放軍63919部隊,未經西安交通大學;中國人民解放軍63919部隊許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210342799.7/2.html,轉載請聲明來源鉆瓜專利網。





