[發明專利]一種基于約束模糊聚類和粒計算的網絡流量分類方法有效
| 申請號: | 202010465413.2 | 申請日: | 2020-05-28 |
| 公開(公告)號: | CN111786903B | 公開(公告)日: | 2022-02-25 |
| 發明(設計)人: | 靖旭陽;趙晶晶;閆崢;維托爾德·佩德里茨 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | H04L47/2441 | 分類號: | H04L47/2441;G06K9/62;G06N20/00 |
| 代理公司: | 西安長和專利代理有限公司 61227 | 代理人: | 黃偉洪 |
| 地址: | 710071 陜西省*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 約束 模糊 計算 網絡流量 分類 方法 | ||
1.一種基于約束模糊聚類和粒計算的網絡流量分類方法,其特征在于,所述基于約束模糊聚類和粒計算的網絡流量分類方法為:
在訓練階段,使用流量信息將帶有標簽的數據集與不帶標簽的數據集合并;
通過自定義約束模糊C均值CCFCM對合并的數據集進行操作,并將一組聚類中心以數值格式輸出;
圍繞數值型的聚類中心構建網絡流量粒,將在合理粒度準則的指導下不斷進行優化;
將獲得的最佳網絡流量粒NTG借助帶有標記的流,每個流量粒將會被映射到相應的流量類別;
從NTG提取數據包級別和流級別特征,構建分類規則庫;
在測試階段,粒分類器借助分類規則識別新的網絡流或網絡異常;
構建網絡流量粒的方法包括以下步驟:
步驟一,利用約束模糊聚類對網絡流量進行聚類;
步驟二,根據聚類結果,建立網絡流量信息粒并構建粒度分類器;
步驟三,基于粒度分類器對網絡流量進行分類;
在步驟一中,
首先,采集網絡流量,從每個流中提取以下特征:流大小,流間隔,數據包大小的最大、最小、均值和標準差,數據包到達間隔的最大、最小、均值和標準差,傳輸的字節數量;給定一個標簽為L={l1,l2,...,ln}的數據流集合S={s1,s2,...,sn},其中si∈Rq,q是特征維數,li∈(Class1,Class2,...ClassK),i∈[1,n],Classp(p∈[1,K])是流量類別,對另一個未標記的數據集T={t1,t2,...};
其次,聚類網絡流量,使用增強系數來指導聚類過程中隸屬度變化的方向,該增強系數僅通過每個簇中包含必須鏈接must-link數據流的比率來計算,CCFCM的目標函數為:
其中,m是模糊系數,c是簇的數量,N是數據流的數量,0≤uik≤1是數據流xk對聚類中心vi的隸屬度并且必須滿足||·||是標準歐幾里得距離,βik是增強系數;
βik的計算公式如下:
如果xk∈RLl并且Card(Ci)≠0
其中,RLl是RLS中的一個相關流子集,Card(Ci)是在第i個簇中與xk為must-link關系的數據流的數量,Card(RLl)是RLl中數據流的數量;
在步驟二中,圍繞由數值數據表示的聚類中心v1,v2,...,vc構建網絡流量粒,將流量粒表示為NTG={G1,G2,...,Gc},其中Gi={Gi1,Gi2,...,Giq},q是流量特征維數,i=1,2,...,c;
流量粒的構建過程如下:
(1)生成網絡流量粒,使用ε-信息粒規則來生成網絡流量粒,網絡流量粒Gi在結構上類似于超級立方體結構,其每一維的計算方式為Gij=[vij-ε/2*rangej,vij+ε/2*rangej],其中vij是數值型中心vi第j維的值,i=1,2,...,c,j=1,2,...,q,ε是Gi的大小,rangej是原始數據值第j維的數值變化范圍;
(2)基于網絡流量粒重構原始數據點,從NTG={G1,G2,...,Gc}中重構數據點xk,重構的數據為一個間隔值,表示為k=1,2,...,N;如果那么這個網絡流量粒對xk的表達能力就認為是好的;
(3)優化網絡流量粒;
計算隸屬度的方法包括:
(1)如果xk∈Gi,i=1,2,...,c,那么xk對Gi的隸屬度為而對其他流量粒的隸屬度則為g=1,2,...,c and g≠i,使用Gi表示,
(2)如果i=1,2,...,c,通過隸屬度聚合和已構建的網絡流量信息粒進行去模糊運算以計算的計算公式如下:
其中和是Gi的下界與上界.對第j個維度,的計算公式為:
其中
在步驟三中,基于粒中包含的數據點來判斷類別,如果一個流量粒中不包含任何帶有標簽的流,就將其視為未知類別,在分類階段不使用它;對于至少包含一個帶標簽的流的粒,根據其中不同標記的流的數量比較來分配其流量類別;
設置包級別和流級別的規則庫,從每個網絡流量粒中提取的單個流的分類規則,以及從每個流量類別中提取的應用程序行為的識別規則;對于單個流分類,計算流與每個網絡流量粒之間的距離;
對一個新的流y∈Rq,按照一下步驟進行分類:
·如果y∈Gi(i=1,2,...,r),即yj在流量粒Gij(j=1,2,...,q)內部,這里Gi∈TCp(p∈[1,K]),那么就把流y的標簽記為Classp;
·如果需要計算流y與流量粒Gi(i=1,2,...,r)之間的距離,將其分到包含與流y最近的Gi的集合類別TCp(p∈[1,K])中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010465413.2/1.html,轉載請聲明來源鉆瓜專利網。





