[發明專利]一種自適應更新的網絡入侵檢測方法有效
| 申請號: | 202110791305.9 | 申請日: | 2021-07-13 |
| 公開(公告)號: | CN113379000B | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 陳文;顧守珂;康明 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06F21/57 |
| 代理公司: | 四川省成都市天策商標專利事務所(有限合伙) 51213 | 代理人: | 張秀敏 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自適應 更新 網絡 入侵 檢測 方法 | ||
1.一種自適應更新的網絡入侵檢測方法,其特征在于,包括:
步驟S100:通過特征空間映射,在不同的特征空間下訓練多個分類模型;
步驟S200:多個分類模型協同進行入侵檢測;
步驟S300:多個分類模型根據當前樣本分布與歷史樣本分布的差異自動更新觸發;
步驟S400:多個分類模型協同進行自適應更新;所述步驟S100具體包括:
步驟S110:收集初始已標記樣本集Dataoriginal,Dataoriginal={xi,yi|xi∈Rd,1≤i≤L},其中Rd代表d維實數向量集,xi在每一維的值代表一種網絡數據流特征值,取值包括網絡入侵檢測數據流特征中的源IP、目的IP、源端口、目的端口、TTL時長、session會話錯誤、包負載大小、數據包負載特征值及其線性組合,L為已標記樣本數量,yi代表樣本xi的標簽類別,yi∈{‘正?!?‘異?!瘆;
步驟S120:將初始已標記樣本集Dataoriginal中的樣本映射到特征空間Vj,Vj為低維特征空間或深度神經網絡DNN的隱含層特征空間:
其中,是dj維實數向量集,代表映射后的特征空間,為映射函數,映射函數為PCA降維函數或DNN深度神經網絡,將d維向量映射到dj維特征空間Vj,θj代表映射函數的參數,j=1,2,…,n;Dataoriginal中的樣本映射到Vj后產生的樣本集合為
步驟S130:在差異化的特征空間V1,V2,…,Vj,…,Vn中,分別基于數據集Data’1,Data’2,…,Data’j,…,Data’n訓練n個不同的分類模型Dj,j=1,2,…,n;
所述步驟S200具體為:
步驟S210:提取網絡數據流的原始特征,構成待測試樣本集Datatest={xp|xp∈Rd,1≤p≤mt},mt為待測試樣本集中樣本的數量;
步驟S220:將待測試樣本集Datatest中的樣本{xp,xp∈Rd,1≤p≤mt}分別映射到n個特征空間Vj,獲得映射后的樣本集Data’testj:
其中,j=1,2,…,n;xp為待測試樣本集Datatest中第p個樣本;
步驟S230:利用分類模型Dj對Data’testj中的每個樣本劃分類別,j=1,2,…,n,具體包括:
步驟S231:令p=1;
步驟S232:令j=1,對于樣本xp∈Datatest,初始化樣本xp被分類為‘正常’的數量Tnp=0,初始化樣本xp被分類為‘異?!臄盗縏ap=0;
步驟S233:在特征空間Vj中,分類模型Dj對樣本的分類結果為‘正?!?,則Tnp=Tnp+1;否則Tap=Tap+1;
步驟S234:j=j+1,若j<n,返回步驟S233執行;否則進入下一步;
步驟S235:若TnpTap,則xp對應的標記類別yp為‘正常’,否則yp為‘異?!M入下一步;
步驟S236:p=p+1,若p≤mt,返回步驟S232執行;否則結束;
所述步驟S300包括:n個分類模型周期性的執行模型自動更新自動觸發檢查,檢查過程如下:
在更新周期內進行自動采樣,根據采樣得到的樣本值,通過Parzen窗法計算歷史網絡數據流特征樣本在每個特征維度取值的概率分布Pr(x)、以及當前時間周期窗口下新收集的網絡樣本在每個特征維度取值數據分布Qr(x),1≤r≤d,d為數據維數;隨后計算Pr(x)與Qr(x)間的KL距離,KL距離用于量化數據的概率分布的變化:
其中Xc為更新周期內進行自動采樣的樣本集合;
計算加權KL距離S:
其中ωr為對應維度的權重;
當S超出閾值λ1,則自動觸發入侵檢測模型更新;
所述步驟S400具體包括:依次對每一個分類模型執行下述更新過程:
步驟S410:采集更新周期的網絡通信數據流,提取其中的網絡數據流原始特征,構成更新樣本集合Dataupdate={xs|xs∈Rd,1≤s≤U},U為更新樣本數量;將Dataupdate中的樣本映射到的特征空間Vj,獲得映射后的樣本集
步驟S420:對于特征空間Vj訓練出來的分類模型Dj,j=1,2,…,n,由其余特征空間訓練出的n-1個分類模型Dk,k=1,2…n,且j≠k,通過投票機制從Dataupdate中為Dj產生更新用的新標記樣本,具體如下:
步驟S421:對于更新樣本xq∈Dataupdate,q=1,2,…,U,若在特征空間Vk中,k=1,2,…,n且k≠j,分類模型Dk對的分類結果為‘正?!?,則累加xq被分類為‘正常’的數量Tnq,否則累計xq被分類為‘異?!臄盗縏aq,若TnqTaq,則xq對應的類別標記yq為‘正?!?,否則yq為‘異?!?/p>
步驟S422:并將xq,yq放入新標記樣本集Lj;
步驟S430:對第j個分類模型Dj,j=1,2,…,n,獲得的新標記樣本集Lj進行可信度評估,具體包括:
步驟S431:定義概率傳播矩陣P,具體如下:
定義XU為隨機采集更新周期內的少量樣本集,XU={x1,x2,...,xv,...,xu},對XU中樣本進行人工標記,得到人工標記的標簽集合Y’U,Y’U={y1,y2,...,yv,...,yu},其中yv=[pv1,pv2],v=1,2...u,pv1、pv2分別表示XU中已標記樣本xv屬于‘正常’和‘異?!母怕?;
從新標記樣本集Lj中隨機選出子集XL={x1,x2,...,xl},XL對應的標簽集合YL={y1,y2,…,yl},令X=[XL∪XU]T;定義規模為(l+u)*2的標簽類別概率矩陣Y=[YL,YU]T,Y中第e行,第f列的元素Yef表示X中第e個樣本xe屬于類別f的概率,1≤e≤l+u,1≤f≤2,YU為標簽傳播結果集合,初始時YU設置為規模為u*2的0矩陣;
定義樣本xe∈X、xz∈X,xe與xz之間的相似度wez:
其中,d代表樣本維數,xet代表樣本xe的第t維屬性值,xzt代表樣本xz的第t維屬性值,σ為量化參數,則規模為(l+u)*(l+u)的概率傳播矩陣P中第e行,第z列的元素Pez:
其中,1≤e,z≤l+u,Pez代表將樣本xe的標簽傳遞給樣本xz的概率;
步驟S432:對于分類模型Dj,對新標記樣本集Lj進行基于標簽傳播的置信評估:
1)臨時變量YTemp=YU;
2)計算概率傳播矩陣P與標簽類別概率矩陣Y的乘積PY,更新標簽類別概率矩陣Y,Y=PY;
3)替換標簽類別概率矩陣Y的前l行為YL,保持YL中的類別標簽不變;
4)令F=|YTemp-YU|,若矩陣F中的全部元素之和小于閾值λ,則輸出YU,迭代結束,進入下一步,否則跳轉2);
5)計算人工標記的標簽集合Y’U與標簽傳播結果集合YU的差異VD=|YU-Y’U|,若VD中元素的累積和值超過閾值λ2,則表明本次多個分類模型通過投票機制為分類模型Dj協同產生的新標記樣本Tj中存在較高的標記錯誤率,舍棄Lj,返回步驟S400;否則利用樣本集合Lj∪XU組成新的樣本集,通過特征空間映射,在特征空間Vj下對分類模型Dj,j=1,2,…,n進行更新訓練,實現多個分類模型的自適應更新。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110791305.9/1.html,轉載請聲明來源鉆瓜專利網。





