[發(fā)明專(zhuān)利]基于多維Epanechnikov核密度估計(jì)的異常檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410116085.X | 申請(qǐng)日: | 2014-03-26 |
| 公開(kāi)(公告)號(hào): | CN103916896B | 公開(kāi)(公告)日: | 2017-05-24 |
| 發(fā)明(設(shè)計(jì))人: | 李光輝;朱虹 | 申請(qǐng)(專(zhuān)利權(quán))人: | 浙江農(nóng)林大學(xué) |
| 主分類(lèi)號(hào): | H04W24/04 | 分類(lèi)號(hào): | H04W24/04;H04W84/18 |
| 代理公司: | 杭州九洲專(zhuān)利事務(wù)所有限公司33101 | 代理人: | 王洪新 |
| 地址: | 311300 浙江省杭州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 多維 epanechnikov 密度 估計(jì) 異常 檢測(cè) 方法 | ||
技術(shù)領(lǐng)域
本專(zhuān)利涉及無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)可靠性檢測(cè)方法,尤其是一種基于多維Epanechnikov(葉帕涅奇尼科夫,俄國(guó)人)核密度估計(jì)異常值檢測(cè)方法。
背景技術(shù)
真實(shí)的生活環(huán)境中存在的很多物理現(xiàn)象(比如溫度、濕度、大氣壓力等)都需要持續(xù)地被監(jiān)測(cè)。無(wú)線(xiàn)傳感器網(wǎng)絡(luò)(WSN)作為一種非常重要的數(shù)據(jù)來(lái)源,其采集的數(shù)據(jù)非常容易受到各種噪聲來(lái)源的影響,比如節(jié)點(diǎn)軟硬件故障,節(jié)點(diǎn)通信時(shí)遇到的環(huán)境噪聲。這些噪聲會(huì)嚴(yán)重影響傳感器的讀數(shù),以及數(shù)據(jù)的分布情況,導(dǎo)致傳感器產(chǎn)生不精確的或錯(cuò)誤的數(shù)據(jù)。因此設(shè)計(jì)一種有效的傳感器數(shù)據(jù)流分析處理方法是近年來(lái)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)異常檢測(cè)研究的重點(diǎn)。目前,大多數(shù)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)方法并不能滿(mǎn)足實(shí)際應(yīng)用的精度要求,而能夠滿(mǎn)足精度要求的算法又有很高的計(jì)算復(fù)雜度。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于多維Epanechnikov核密度估計(jì)的無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)異常值檢測(cè)方法;該方法能準(zhǔn)確檢測(cè)出異常數(shù)據(jù),并具有無(wú)需設(shè)置閾值、通信開(kāi)銷(xiāo)大大降低的特點(diǎn)。
本發(fā)明提供的技術(shù)方案是:一種基于多維Epanechnikov核密度估計(jì)的異常檢測(cè)方法,依次包括以下步驟:
1)所有分布節(jié)點(diǎn)各自采集數(shù)據(jù),接著利用基于第k個(gè)最近距離的采樣方法進(jìn)行異常值診斷,如果數(shù)據(jù)是正常值,就直接上傳給簇首節(jié)點(diǎn),如果是異常的,就將該異常值刪除;
2)在簇首節(jié)點(diǎn)滑動(dòng)窗口內(nèi)形成正常數(shù)據(jù)樣本,根據(jù)該樣本在簇首節(jié)點(diǎn)滑動(dòng)窗口內(nèi)建立核密度估計(jì)模型:
其中,X=(x1,x2,…,xd)的核函數(shù)為k(X),且滿(mǎn)足Rd表示d維歐式空間。則
式中:滑動(dòng)窗口寬度d為數(shù)據(jù)維數(shù),σi表示數(shù)據(jù)集在第i維上的標(biāo)準(zhǔn)偏差(i=1,2,…,d),n為簇首節(jié)點(diǎn)滑動(dòng)窗口內(nèi)數(shù)據(jù)樣本中數(shù)據(jù)的個(gè)數(shù),n=|sc|;
3)上述核密度估計(jì)模型發(fā)送給各分布節(jié)點(diǎn),各分布節(jié)點(diǎn)利用該核密度估計(jì)模型判斷下一時(shí)刻各分布節(jié)點(diǎn)內(nèi)到達(dá)的數(shù)據(jù)是否異常;若則認(rèn)為該數(shù)據(jù)是異常值;
4)每隔時(shí)間T,各分布節(jié)點(diǎn)主動(dòng)向簇首節(jié)點(diǎn)發(fā)送最新一段時(shí)間的正常數(shù)據(jù);
5)返回至步驟一。
所述步驟一中基于第k個(gè)最近距離的采樣方法按以下步驟進(jìn)行:
(1)設(shè)分布節(jié)點(diǎn)Ndj滑動(dòng)窗口內(nèi)初始數(shù)據(jù)
(2)計(jì)算兩個(gè)時(shí)刻數(shù)據(jù)值之間的歐氏距離并令矩陣A中的元素為(一維數(shù)據(jù)采用減法取差的方法,二維以上數(shù)據(jù)采用歐氏距離)。
(3)將矩陣A的每一行按升序排序,得到矩陣A’;
(4)判斷矩陣A’中每一行中第k個(gè)數(shù)(m初始值為1,θ為事先設(shè)定的閾值)是否成立,若成立,初始數(shù)據(jù)X(j)中第m個(gè)數(shù)據(jù)為異常值刪除,否則作為正常數(shù)據(jù)上傳給簇首節(jié)點(diǎn)。
式中各分布節(jié)點(diǎn)的滑動(dòng)窗口內(nèi)的數(shù)據(jù)集合為其中N為分布節(jié)點(diǎn)上的滑動(dòng)窗口大小。
本發(fā)明的主要?jiǎng)?chuàng)新之處如下:
對(duì)于目前大規(guī)模無(wú)線(xiàn)傳感器網(wǎng)絡(luò)復(fù)雜的異常檢測(cè),本發(fā)明首先用基于第k個(gè)最近距離的采樣方法將各分布節(jié)點(diǎn)的異常數(shù)據(jù)刪除,將正常數(shù)據(jù)傳給簇首節(jié)點(diǎn)建立核密度估計(jì)模型,再根據(jù)該模型來(lái)檢測(cè)未來(lái)每一時(shí)刻各分布節(jié)點(diǎn)內(nèi)到達(dá)的數(shù)據(jù)是否異常。核密度估計(jì)模型是用來(lái)計(jì)算數(shù)據(jù)的概率分布函數(shù)值,即PDF值,根據(jù)Epanechnikov核函數(shù)的獨(dú)有特征,其在有限范圍之外值都是零,如果某一時(shí)刻進(jìn)入傳感器的數(shù)據(jù)其PDF值為0,那么就認(rèn)為其是異常值。這種方法與以往基于密度的異常檢測(cè)算法相比,無(wú)需設(shè)置閾值,無(wú)需在調(diào)整合適的閾值上花費(fèi)大量精力。與當(dāng)前很多異常值檢測(cè)算法(將所有的傳感器原始數(shù)據(jù)都收集到簇首節(jié)點(diǎn)作集中式處理的方法)比較,大大降低了通信開(kāi)銷(xiāo),并且無(wú)需設(shè)置閾值,可準(zhǔn)確檢測(cè)出異常數(shù)據(jù)。本發(fā)明提出的方法對(duì)傳感器節(jié)點(diǎn)測(cè)量數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,提高了故障檢測(cè)的精度,實(shí)驗(yàn)表明,本發(fā)明提出的方法能夠適應(yīng)大規(guī)模和資源受限的無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中復(fù)雜異常檢測(cè),具有廣闊的應(yīng)用前景。
附圖說(shuō)明
圖1為分布式數(shù)據(jù)流模型示意圖。
圖2為基于多維Epanechnikov核密度估計(jì)模型的異常值檢測(cè)算法的總體流程圖。
具體實(shí)施方式
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于浙江農(nóng)林大學(xué),未經(jīng)浙江農(nóng)林大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410116085.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:益智健腦茶飲品及制備方法
- 下一篇:一種自動(dòng)和面裝置
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 多維、多元生命水及其用途
- 一種多維地址域名解析的方法和裝置以及系統(tǒng)
- 創(chuàng)建多維操作系統(tǒng)的方法和裝置
- 一種對(duì)多維地址數(shù)據(jù)進(jìn)行解析的方法和裝置以及系統(tǒng)
- 一種分組的交付和路由選擇的方法和裝置以及系統(tǒng)
- 多維碼處理方法、發(fā)送端、接收端和系統(tǒng)
- 多維度信息展示方法及裝置
- 一種屏幕可視化方法、裝置、電子設(shè)備及介質(zhì)
- 多維數(shù)據(jù)集的生成方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 多維時(shí)空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)





