[發明專利]一種基于環境監測數據關聯關系的異常數據判定方法在審
| 申請號: | 202010801821.0 | 申請日: | 2020-08-11 |
| 公開(公告)號: | CN112036075A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 孫康;尤洋;郭月;鄭皓皓;秦少立;汪太明;孟雙雙;張霞;楊子成 | 申請(專利權)人: | 中國環境監測總站;廣東旭誠科技有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06N3/04;G06N3/08;G06F16/215 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 曹江;周增元 |
| 地址: | 100020 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 環境監測 數據 關聯 關系 異常 判定 方法 | ||
本發明涉及一種基于環境監測數據關聯關系的異常數據判定方法,主要包括:首先監測數據分為訓練數據、驗證數據和測試數據,用訓練數據構建模型,再用驗證數據根據MAE選擇模型的最佳參數;模型構建并完成調試后,經過測試數據測試,嵌入環境監測平臺。在監測平臺上根據實時監測數據與模型給出下一時刻的預測值,計算預測結果與真實值的絕對值bia,bia與MAE±30%真實值比較后判斷實測值是否異常。本發明充分考慮了氣象條件對監測數據的影響,以及監測數據的時間連續性和變化特點,最終解決多源監測數據缺少自動化質量控制手段的問題,實現了自動化、智能化的對可疑數據進行篩選和判斷功能,保障了數據的質量,為后期數據使用和環境預報預警提供有力支撐。
技術領域
本發明涉及環境實時監測的數據質量控制技術領域,主要用于顆粒物和氣態污染物實時監測數據的異常值自動判斷。
背景技術
對于大氣環境數據質量的控制和監測,目前使用數據篩選方法大多采用手工形式,即通過繪制日均圖、月均圖判斷各監測指標的異常波動和離群程度等。這樣的方法增加了大量的人力資源,面對海量的監測數據,人工審核往往會有遺漏的情況。鑒于環境監測儀器輸出監測物的濃度指標一般以分鐘或小時為單位,人工手動審核數據存在一定的滯后性,通過自動化的審核機制可以做到實時對數據進行質量控制。
針對大氣監測數據缺少自動化質量控制手段的狀況,現依據環境監測總站數據監控和復合采用的技術方案設計算法,實現大氣環境監測數據自動化智能質量控制技術,解決多源監測數據缺少自動化質量控制手段的問題,使大氣監測設備的質量控制遵從同一套方法體系,推進監測設備遠程自動化質控技術的發展。
發明內容
本發明的目的在于提供一種基于環境監測數據關聯關系的異常數據判定方法,以解決多源監測數據缺少自動化質量控制手段等問題。
一種基于環境監測數據關聯關系的異常數據判定方法,包括以下步驟:
S1.對歷史數據及待分析的環境監測數據進行預處理:對歷史數據及待分析的環境監測數據監測數據用數采軟件判斷缺失值和異常值,再替換缺失值和異常值;
S2.將數據劃分為訓練數據、驗證數據,并將訓練數據和驗證數據轉換為模型所需的序列數據;其中訓練集和驗證集數據均包括正常數據以及人工標識為異常的數據,其異常原因包括數據突升/突降、未出現晝夜變化、持續性低值等,異常數據判斷均與前后監測數據連續性相關;訓練集和驗證集數據的比例可以是7:3;
S3.用訓練數據構建模型,再用驗證數據根據平均絕對誤差MAE選擇模型的最佳參數;模型構建并完成調試后,嵌入環境監測平臺中,t-1時刻的待分析的環境監測數據ct-true作為輸入數據,不斷得到t時刻的預測值ct-pre;
S4.將預測值ct-pre與t時刻的待分析的環境監測數據ct-true比較,求出絕對值bia,與MAE±30%真實值的經驗誤差相比,來判定異常,超過該范圍的數據即標記為異常數據,此過程中MAE隨輸入數據變化,因此閾值為動態閾值。
其中bia=|ct-pre-ct-true|。
優選的,步驟S1所述替換缺失值和異常值的方法包括:
S11.線性插值的插值函數為一次多項式,首先假設已知函數y=f(x)在區間[a,b]上(n+1)個互異點xi(i=0,1,2,3...,n)上的值分別為yi,求多項式:
使滿足
由解析幾何可知:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國環境監測總站;廣東旭誠科技有限公司,未經中國環境監測總站;廣東旭誠科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010801821.0/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





