[發(fā)明專利]基于單分類支持向量機(jī)模型發(fā)現(xiàn)環(huán)境監(jiān)測(cè)異常數(shù)據(jù)的算法在審
| 申請(qǐng)?zhí)枺?/td> | 202011509198.8 | 申請(qǐng)日: | 2020-12-18 |
| 公開(公告)號(hào): | CN112613233A | 公開(公告)日: | 2021-04-06 |
| 發(fā)明(設(shè)計(jì))人: | 楊婧;付強(qiáng);柳媛;姚雅偉;米方卓;吳曉鳳;柴文軒;楊楠;王光;朱余;羅財(cái)紅 | 申請(qǐng)(專利權(quán))人: | 中國環(huán)境監(jiān)測(cè)總站 |
| 主分類號(hào): | G06F30/27 | 分類號(hào): | G06F30/27 |
| 代理公司: | 杭州中利知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33301 | 代理人: | 李光 |
| 地址: | 100020 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 分類 支持 向量 模型 發(fā)現(xiàn) 環(huán)境監(jiān)測(cè) 異常 數(shù)據(jù) 算法 | ||
1.基于單分類支持向量機(jī)模型發(fā)現(xiàn)環(huán)境監(jiān)測(cè)異常數(shù)據(jù)的算法,其特征在于:包括以下步驟:
步驟S1.初始化建模數(shù)據(jù)點(diǎn):獲取一定時(shí)間內(nèi)每個(gè)時(shí)間點(diǎn)的當(dāng)前站點(diǎn)的監(jiān)測(cè)數(shù)據(jù)Ti及若干新的站點(diǎn)監(jiān)測(cè)數(shù)據(jù)Rj,其中i,j為正整數(shù);
步驟S2.設(shè)定參數(shù):設(shè)定核函數(shù)k,異常點(diǎn)比例r和誤差閾值tol參數(shù);
步驟S3.模型訓(xùn)練:根據(jù)所設(shè)定參數(shù)規(guī)劃出數(shù)據(jù)點(diǎn)Ti在特征空間中形成樣本空間;將當(dāng)前站點(diǎn)的監(jiān)測(cè)數(shù)據(jù)Ti投入模型框架,迭代至模型與訓(xùn)練數(shù)據(jù)間誤差小于設(shè)定誤差閾值tol,確定模型相關(guān)參數(shù);
在模型的訓(xùn)練過程中,訓(xùn)練目的是期望最后的模型對(duì)于輸入樣本而言,在異常點(diǎn)比例滿足設(shè)定異常點(diǎn)比例r的同時(shí),誤差e小于等于設(shè)定誤差閾值tol;
步驟S4.確定參數(shù)及對(duì)應(yīng)樣本空間:重復(fù)步驟S3,直到模型滿足步驟S3中訓(xùn)練目的,確定對(duì)應(yīng)的樣本空間和邊界;根據(jù)所確定參數(shù)規(guī)劃出數(shù)據(jù)點(diǎn)Ti在特征空間中形成樣本空間,以及該空間對(duì)應(yīng)的范圍數(shù)據(jù);
步驟S5.模型運(yùn)用:輸入新的站點(diǎn)監(jiān)測(cè)數(shù)據(jù)點(diǎn)Rj
步驟S6.判斷離群點(diǎn):判斷新的站點(diǎn)監(jiān)測(cè)數(shù)據(jù)Rj中超出模型邊界點(diǎn)為異常值Rout,在模型邊界中的點(diǎn)為正常值Rin;
步驟S7.動(dòng)態(tài)調(diào)整:利用模型邊界內(nèi)的新加入正常值Rin和原有監(jiān)測(cè)數(shù)據(jù)Ti,重復(fù)步驟S2至步驟S4,優(yōu)化構(gòu)建下一代模型。
2.如權(quán)利要求1所述的基于單分類支持向量機(jī)模型發(fā)現(xiàn)環(huán)境監(jiān)測(cè)異常數(shù)據(jù)的算法,其特征在于:所述步驟S2,S3,S4的具體計(jì)算如下:
對(duì)于Ti個(gè)數(shù)據(jù)點(diǎn)中的每一個(gè)數(shù)據(jù)點(diǎn)t,單分類支持向量機(jī)模型訓(xùn)練的目的是將所有樣本點(diǎn)與原點(diǎn)在特征空間中盡量分開,即最大化分類超平面到原點(diǎn)的距離;
令ψ(t)為將t映射后的特征向量,則樣本點(diǎn)所創(chuàng)建空間可用一個(gè)參數(shù)為w和b的超平面表示:
f(t)=WT·ψ(t)+b
而每個(gè)數(shù)據(jù)點(diǎn)t到特征空間原點(diǎn)的距離可表示為
需要每個(gè)數(shù)據(jù)點(diǎn)t到原點(diǎn)的距離盡可能大,即:
支持向量機(jī)的目標(biāo)就是要最大化這個(gè)幾何間隔1/||w||;在數(shù)學(xué)上,最大化該間隔,可以視為最小化||w||,故可構(gòu)建等價(jià)函數(shù)如下:
為了確定模型邊界,加入一個(gè)支持向量機(jī)為每個(gè)樣本點(diǎn)引入了一個(gè)松弛變量ζ≥0,使得每個(gè)樣本點(diǎn)在間隔的基礎(chǔ)上再加上松弛變量,最終能大于等于設(shè)定距離原點(diǎn)的距離即可;故需要訓(xùn)練的目標(biāo)函數(shù)可表示為:
其中v類似于二分類支持向量機(jī)模型中的懲罰參數(shù),ζ≥0為松弛變量,通過迭代找到一個(gè)最優(yōu)的超平面滿足上述函數(shù)達(dá)到最小值,使得所創(chuàng)建的超平面與特征空間中的原點(diǎn)距離最大,并且將原點(diǎn)與樣本點(diǎn)分隔開;超平面以上的每個(gè)數(shù)據(jù)點(diǎn)t滿足設(shè)定比例r個(gè)點(diǎn)滿足WT·ψ(t)+b≥1-ξi。
3.如權(quán)利要求2所述的基于單分類支持向量機(jī)模型發(fā)現(xiàn)環(huán)境監(jiān)測(cè)異常數(shù)據(jù)的算法,其特征在于:所述步驟S2中提及參數(shù)的具體計(jì)算過程如下:
對(duì)于參數(shù)核函數(shù)參數(shù)k,在上述求解過程中涉及ti,tj映射到特征空間的內(nèi)積ψ(ti)Tψ(tj)的計(jì)算,采用核函數(shù):
k(ti,tj)=<ψ(ti),ψ(tj))>=ψ(ti)T·ψ(tj);
對(duì)于參數(shù)異常點(diǎn)比例r,表示最優(yōu)模型所對(duì)應(yīng)的超平面上,WT·ψ(t)+b+ξi≥1為正常點(diǎn),小于1為異常點(diǎn);設(shè)定比例r個(gè)點(diǎn)為滿足WT·ψ(t)+b≥1-ξi的正常點(diǎn);1-r比例個(gè)點(diǎn)為離群值;
對(duì)于參數(shù)誤差閾值tol,指定使算法優(yōu)化過程停止的誤差閾值tol,當(dāng)優(yōu)化結(jié)果的誤差小于該數(shù)值時(shí),即e≤tol時(shí),停止計(jì)算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國環(huán)境監(jiān)測(cè)總站,未經(jīng)中國環(huán)境監(jiān)測(cè)總站許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011509198.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類別向量的方法和裝置





