[發明專利]基于特征自適應層次聚類的網絡流量圖像安全分類方法有效
| 申請號: | 202110015140.6 | 申請日: | 2021-01-06 |
| 公開(公告)號: | CN112688961B | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 陳紅松;孫學潔 | 申請(專利權)人: | 北京科技大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L12/24;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波;鄧琳 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 自適應 層次 網絡流量 圖像 安全 分類 方法 | ||
1.一種基于特征自適應層次聚類的網絡流量圖像安全分類方法,其特征在于,包括以下步驟:
S1、輸入原始網絡流量數據,提取網絡流量特征,為每條網絡流量特征標注類別標簽,得到原始網絡流量特征數據集;
S2、讀取所述原始網絡流量特征數據集的前W列,記為矩陣AH×W,生成大小為H×W的網絡流量圖像,其中高度H代表網絡數據流數量,寬度W代表網絡流量特征數量,并將矩陣AH×W轉置為矩陣A'W×H;
S3、基于自適應層次聚類算法優化選取聚類數量n_cluster,使得類間距離大于第一預設值,類內距離小于第二預設值;
本步驟中,基于自適應層次聚類算法,將網絡流量圖像特征的每一列設定為一類,計算兩兩之間的曼哈頓距離,當滿足類間距離大于第一預設值且類內距離小于第二預設值時,則合并為一類,通過凝聚法層層合并,直至2n_cluster-1層停止,對相似的網絡流量特征進行聚合;
利用類間類內距離比J和輪廓系數SC評估不同聚類數n_cluster下聚類模型的聚類效果,SC∈[-1,1],其中SC趨近于1時,聚類效果最好,此時對應的n_cluster值為最優;
S4、采用最優的n_cluster值對網絡流量圖像的特征進行聚類,得到對應的網絡流量特征聚類結果;
S5、根據網絡流量特征的類別標簽重新排列網絡流量特征,得到矩陣BW×H,并轉置為矩陣B'H×W;
S6、分別對矩陣A'W×H和矩陣B'H×W進行按類別切割,生成原始網絡流量切割圖像和聚類網絡流量切割圖像,并標注類別標簽;
S7、將原始網絡流量切割圖像放入原始數據集,將聚類網絡流量切割圖像放入切割數據集,并將原始數據集和切割數據集帶入分類模型進行分類;
S8、對分類預測的準確率進行測試。
2.根據權利要求1所述的基于特征自適應層次聚類的網絡流量圖像安全分類方法,其特征在于,所述步驟S1具體包括:
輸入原始網絡流量pcap數據包,通過CICFlowMeter網絡流量特征提取工具提取網絡流量特征,對提取的網絡流量特征進行規范化處理:為每條網絡流量特征標注類別標簽i,其中i=0、1、2、3、…,獲得原始網絡流量特征數據集Df。
3.根據權利要求1所述的基于特征自適應層次聚類的網絡流量圖像安全分類方法,其特征在于,所述步驟S6具體包括:
設定網絡流量切割圖像大小為H’×W,其中高度H’代表每個切割窗口包含網絡數據流數量,寬度W代表網絡流量特征數量;設定切割閾值為δ,從B'H×W的第一條數據的標簽開始讀取,每讀取一個標簽,相應的類別計數加一;當其中類別計數大于等于δ時,B'H×W矩陣相應窗口內數據轉化為H’×W大小的圖像,標注標簽為i,循環上述操作直至讀取到B'H×W最后一條數據,并對A'W×H進行同樣操作。
4.根據權利要求3所述的基于特征自適應層次聚類的網絡流量圖像安全分類方法,其特征在于,所述步驟S7具體包括:
將對矩陣B'H×W切割后圖像放入切割數據集Dc(i)中,將對矩陣A'W×H切割后圖像放入原始數據集Do(i)中,并將Do(i)和Dc(i)帶入分類模型進行分類。
5.根據權利要求4所述的基于特征自適應層次聚類的網絡流量圖像安全分類方法,其特征在于,所述步驟S8具體包括:
利用基于LeNet-5的CNN網絡結構,通過卷積層提取網絡流量特征圖像有效特征,利用全連接層對網絡流量特征進行分類,進一步調整卷積層參數,采用機器學習分類模型對聚類后網絡流量圖像數據集進行訓練和測試,得到分類預測的準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京科技大學,未經北京科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110015140.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙質量飛輪
- 下一篇:基于大數據的電商產品模擬系統





