[發(fā)明專利]一種基于分布式在線主成分分析的空氣質(zhì)量異常檢測方法有效
| 申請?zhí)枺?/td> | 201810129053.1 | 申請日: | 2018-02-08 |
| 公開(公告)號: | CN108490115B | 公開(公告)日: | 2020-06-05 |
| 發(fā)明(設計)人: | 李春光;苗雪丹;王濤 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G01N33/00 | 分類號: | G01N33/00 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分布式 在線 成分 分析 空氣質(zhì)量 異常 檢測 方法 | ||
本發(fā)明公開了一種基于分布式在線主成分分析的空氣質(zhì)量異常檢測方法。獲取城市的已知空氣污染物濃度數(shù)據(jù),設計分布式在線主成分分析模型,采用基于分布式在線主成分分析模型的空氣質(zhì)量異常檢測方法對空氣污染物濃度數(shù)據(jù)進行處理獲得判斷結果,從而對空氣質(zhì)量進行異常檢測。本發(fā)明能便捷地預測某一范圍內(nèi)的整體空氣質(zhì)量,能夠抑制異常訓練數(shù)據(jù)帶來的影響,起到去噪作用,處理速度更快,用時更短。
技術領域
本發(fā)明屬于分布式信號處理、機器學習以及異常檢測領域,特別是涉及一種基于分布式在線主成分分析的空氣質(zhì)量異常檢測方法。
背景技術
主成分分析(Principal Component Analysis,簡稱PCA)是一種常用的無監(jiān)督降維方法。通過PCA能夠得到數(shù)據(jù)分布的主要方向。常規(guī)的PCA通過構造數(shù)據(jù)協(xié)方差矩陣并計算其特征向量來實現(xiàn)主成分分析過程。這些特征向量是原始數(shù)據(jù)空間中含信息量較多的方向,因此被視為主要成分或主要方向。對于常規(guī)的PCA而言,一般需要獲得全部的原始數(shù)據(jù),生成原始數(shù)據(jù)的協(xié)方差矩陣。顯然主成分分析方法可以應用于異常檢測領域,通過分析得到訓練數(shù)據(jù)的主要成分,然后根據(jù)主要成分判斷測試數(shù)據(jù)是否異常。
在實際中,用于異常檢測的數(shù)據(jù)可以通過無線傳感器網(wǎng)絡(wireless sensornetworks,簡稱WSNs)來進行采集。例如,利用氣體傳感器組成的傳感器網(wǎng)絡測量空氣中污染物的濃度。一般來說,衡量空氣質(zhì)量的主要指標是空氣中主要污染物,即SO2、NO2、CO、PM10、PM2.5和O3的濃度。可以通過氣體傳感器分散地測量空氣中各個污染物的濃度,然后通過合理的計算確定最終的空氣質(zhì)量。在這種情況下,數(shù)據(jù)是分散地被多個傳感器節(jié)點采集的,因此常規(guī)PCA利用數(shù)據(jù)協(xié)方差矩陣求解主成分的方法顯然是不太合適的。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對數(shù)據(jù)是分布式采集的這樣一種實際情況,提出一種基于分布式在線主成分分析的空氣質(zhì)量異常檢測方法,通過不需要數(shù)據(jù)協(xié)方差矩陣的分布式在線主成分分析方法進行空氣質(zhì)量數(shù)據(jù)的異常檢測。
如圖1所示,本發(fā)明所采用的技術方案具體包括如下步驟:
(1)獲取城市的已知空氣污染物濃度數(shù)據(jù);
(2)設計分布式在線主成分分析模型;
(3)采用基于分布式在線主成分分析模型的空氣質(zhì)量異常檢測方法對待測空氣污染物濃度數(shù)據(jù)進行處理獲得該城市的判斷結果,從而對空氣質(zhì)量進行異常檢測。
所述步驟(1)的城市的已知空氣污染物濃度數(shù)據(jù)是包括某一城市在某一時間段內(nèi)的每日多地點空氣污染物濃度數(shù)據(jù)。
具體實施中,將得到的空氣污染物濃度數(shù)據(jù)分成訓練所用空氣污染物濃度數(shù)據(jù)及測試所用空氣污染物濃度數(shù)據(jù)。
具體實施中可在環(huán)保部數(shù)據(jù)中心及相關的網(wǎng)站上獲得空氣污染物濃度數(shù)據(jù),例如在青悅開放環(huán)境數(shù)據(jù)中心獲得杭州市每日空氣污染物濃度的歷史數(shù)據(jù)。
所述的空氣污染物濃度數(shù)據(jù)是由傳感器網(wǎng)絡采集獲得的,傳感器網(wǎng)絡是由分布于不同地點的傳感器節(jié)點用無線/有線方式互相連接而組成,每兩個傳感器節(jié)點具有直接/間接通信連接關系,每個傳感器節(jié)點采集獲得各自監(jiān)測范圍的空氣污染物濃度數(shù)據(jù),每個傳感器節(jié)點均能接收其他所有鄰居傳感器節(jié)點依據(jù)所采集到的空氣污染物濃度數(shù)據(jù)計算出的每個時刻的特征矩陣信息。
所述的步驟(2)具體建立以下公式表示的傳感器節(jié)點的目標函數(shù)作為分布式在線主成分分析模型(doPCA模型):
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經(jīng)浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810129053.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:用于手持式電子鼻的仿生氣室
- 下一篇:一種新型智能甲醛檢測預警設備





