[發明專利]相關雙數據流異常檢測與修正的方法有效
| 申請號: | 201710058111.1 | 申請日: | 2017-01-23 |
| 公開(公告)號: | CN108345574B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 吳宏杰;張聰;章曉明;秦寧寧;朱樹才 | 申請(專利權)人: | 無錫市計量測試院 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 彭素琴 |
| 地址: | 214122 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相關 雙數 異常 檢測 修正 方法 | ||
1.一種相關雙數據流異常檢測與修正的方法,其特征在于,所述相關雙數據流是指:作為輸入數據流的數據和作為輸出數據流的數據,且輸入數據流是輸出數據流的函數,所述方法包含對雙數據流的離線處理過程和在線處理過程,在線處理過程可以完成對異常數據的修正;離線處理過程中,雙數據流基于相同時間序列I={i|1,2,…,n};其中,為便于表述,一輪生產過程被劃分為n個時間序列,每個序號也稱為時間索引號i,最末端的索引號為n;生產過程中,會對輸入數據流和輸出數據流進行多輪次的采集與記錄,其中輸入數據流為X,輸出數據流為Y;第j輪采集的數據流標記為Xj={xj1,xj2…,xjn}和Yj={yj1,yj2…,yjn};若共計輸入數據和輸出數據被采集了m輪,則每輪在第i個索引號處的采樣數據以數據簇CXi=[x1i … xmi]T,CYi=[y1i … ymi]T表示;在線處理過程中,某一輪基于序列I采集的輸入數據流為X={x1,x2,x3,...xn},采集的輸出數據流為Y={y1,y2,y3,...,yn},X和Y中均包含了不確定的異常數據,X和Y為將被檢測和修正的目標數據流;其中離線處理過程描述如下:若共計輸入數據和輸出數據被采集了m輪,對I的每個索引號i的數據簇CXi,CYi,分別計算其簇中心和形成離線簇中心集合和分別建立時間索引I與CCSx,CCSy的映射關系曲線CCIC:CCSx→fx(I)和CCSy→fy(I),fx表示I與CCSx之間的映射關系,fy表示I與CCSy之間的映射關系;
所述方法包括對每一次采集到的索引號為k的新數據,向前提取寬度為w的數據窗口,對其進行異常數據檢測和修正的在線處理過程,步驟如下:
步驟1:標記已提取的數據窗口分別為Xk={xk-w+1,xk-w,…,xk}和Yk={yk-w+1,yk-w,…,yk},并在簇中心集合中,對應提取和其中n≥k≥w-1,w≥1,若遇到當前數據的索引號為本輪較為靠前的數據,即1≤k<w-1,w≥1時,則從前一輪采集的數據中順次選取最新的數據,保持窗口數據寬度為w;
步驟2:對數據窗口Xk進行異常數據檢測和修正,得到修正后無異常數據窗口Xk*;
步驟3:基于公式(1)和(2),形成在線簇中心集合CCSxk*,CCSyk*:
步驟4:計算CCSxk*和CCSxk的協方差向量c和CCSxk的協方差矩陣C,基于公式(3)的GPR預測模型,得到預測輸出Yk'={yk-w+1',yk-w',…,yk'},數據序列yk-w+1',yk-w',…,yk'是以修正后的輸入數據的數據窗口數據Xk*為輸入值,基于離線信息和GPR預測模型,得到的預測輸出數據的數據窗口的預測數據;
Yk'=cT(CCSxk*)C-1CCSyk (3)
步驟5:對預測輸出數據Yk'進行對比檢測,間接實現對Y中異常數據的檢測和修正;
步驟6:雙數據流異常數據檢測和修正的在線處理過程結束,輸出修正后無異常數據流Xk*和Yk*。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫市計量測試院,未經無錫市計量測試院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710058111.1/1.html,轉載請聲明來源鉆瓜專利網。





