[發(fā)明專利]一種基于近鄰自編碼器的近鄰異常檢測系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011243520.7 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112348090A | 公開(公告)日: | 2021-02-09 |
| 發(fā)明(設計)人: | 馬帥;劉叔正 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 北京中創(chuàng)陽光知識產權代理有限責任公司 11003 | 代理人: | 牛雅芳 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 近鄰 編碼器 異常 檢測 系統(tǒng) | ||
1.一種基于近鄰自編碼器的近鄰異常檢測系統(tǒng),其特征在于:系統(tǒng)設計針對KNN的降維-檢測框架,通過輸入模塊導入異常數(shù)據(jù)集,經過所述KNN的降維-檢測框架運算后,通過輸出模塊輸出異常數(shù)據(jù)集異常得分,從而判斷輸入數(shù)據(jù)集中的異常情況;
具體地,系統(tǒng)首先通過KD-tree計算每個數(shù)據(jù)點的K個近鄰點組成的近鄰集合,K∈[25,200],將近鄰集合U、V和原始數(shù)據(jù)輸入基于神經網路結構設計的近鄰自編碼器進行降維計算,集合U為某個數(shù)據(jù)點從1-近鄰到m-近鄰的m個數(shù)據(jù)點形成的集合;同理,集合V為某個數(shù)據(jù)點X的從(k-m+1)-近鄰到K-近鄰的m個數(shù)據(jù)點形成的集合,m∈[1,5],獲得保持近鄰關系的低維數(shù)據(jù)嵌入和每個點的重構誤差,將數(shù)據(jù)嵌入和重構誤差輸入到K-重構-近鄰檢測器,得出異常分,所述近鄰自編碼器和所述K-重構-近鄰檢測器由參數(shù)選擇方案確定其系統(tǒng)參數(shù)。
2.根據(jù)權利要求1所述的一種基于近鄰自編碼器的近鄰異常檢測系統(tǒng),其特征在于:所述近鄰自編碼器的具體實現(xiàn)方式為:將自編碼器在隱層中對近鄰關系的刻畫分為兩個正則項:首先,將第一項正則項設置為點和原始近鄰點的集合的的距離之和的相反數(shù);其次,使用每個點的第K近鄰的距離作為異常分,即K近鄰的近鄰關系需要保持不變,第二項正則項設置為在隱層中點和他原始K近鄰的距離;
給定K近鄰的參數(shù)K和范圍超參數(shù)m,首先在原始空間中用KD-tree求出原始數(shù)據(jù)點的K個最近鄰,設I是數(shù)據(jù)集中的一個原始數(shù)據(jù)點,K近鄰的參數(shù)是K,U是I從1到M的近鄰集合,V是點I從(K-m+1)到K的近鄰集合,設集合U包含點I的1到m-最近鄰,集合V包含點I的K-m+1到K-最近鄰,將原始點和近鄰集合分別輸入近鄰自編碼器,通過原始點的重構誤差和隱層內的近鄰誤差訓練自編碼器,
首先定義一個含有n層全連接層的編碼器,
E(I)=fn(fn-1(...f1(I)))
其中每層全連接層的變換為,
其中X和B分別是第i層的屬性權重和偏差,
解碼器變換定義為,
D(E(I))=gn(gn-1(...g1(E(I))))
gi(X)=WX+B,i∈[1,n]
損失函數(shù)定義為,
Rj=(Ij-D(E(Ij)))2
在迭代訓練NNAE后,獲得原始數(shù)據(jù)的嵌入表示和每個數(shù)據(jù)的重構誤差,
E(I)
R=I-D(E(I))。
3.根據(jù)權利要求2所述的一種基于近鄰自編碼器的近鄰異常檢測系統(tǒng),其特征在于:所述K-重構-近鄰檢測器的實現(xiàn)方式為:定義一個數(shù)據(jù)點的第K近鄰到它本身的距離為d,重構誤差為r,整個數(shù)據(jù)集中最大的重構誤差為rmax,最小的為rmin,KRNN的異常分為:
所述參數(shù)選擇方案具體為:近鄰自編碼器由多層全連接層構成,層數(shù)參數(shù)設置為L,同時使用緊縮系數(shù)α描述網絡形狀,L∈[3,5,7,9],α∈[0.2,0.4,0.6,0.8],使用對稱結構的自編碼器,編碼器和解碼器的權重W和偏差B各自獨立,但結構對稱,隱層無激活函數(shù),其他層間均使用sigmoid激活函數(shù);選定有效結構參數(shù)L和α的方法為:首先定義集合N1為在數(shù)據(jù)集中通過NNAE獲得的重構誤差低于其他50%數(shù)據(jù)的點的集合,N2為重構誤差高于其他95%數(shù)據(jù)的點的集合,則性能指標Z可以定義為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011243520.7/1.html,轉載請聲明來源鉆瓜專利網。





