[發明專利]一種網絡流量分類方法有效
| 申請號: | 201811535347.0 | 申請日: | 2018-12-14 |
| 公開(公告)號: | CN109726744B | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 趙世林;葉可江;須成忠 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京市誠輝律師事務所 11430 | 代理人: | 范盈 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡流量 分類 方法 | ||
本申請屬于網絡流量管理技術領域,特別是涉及一種網絡流量分類方法。隨著未知流量的多變化和復雜化,已存在的分類方法在特征提取模塊和分類算法模塊卻不能達到很好的分類效果;不能精確檢測和識別出未知流量。本申請提供了一種網絡流量分類方法,采集網絡流量樣本數據;對樣本數據進行預處理,得到樣本數據集;對樣本數據打標簽,得到標簽數據集;將有標簽的數據集和未知標簽的數據集整合,得到混合訓練數據集;對標簽數據集的網絡流進行分層協議特征提取,得到特征流數據集;采用聚類算法對混合訓練數據集和特征流數據集進行訓練建模和測試驗證;輸出分類結果。能充分利用網絡流間關聯信息,經過訓練,對未知流量進行精準的分類和識別。
技術領域
本申請屬于網絡流量管理技術領域,特別是涉及一種網絡流量分類方法。
背景技術
隨著互聯網技術的高速發展,網絡環境隨之也變得非常復雜和多樣化,因此對網絡的正常運行、網絡服務、資源實時分配和流量管理有更高的要求,此時有效的監管網絡活動的方法非常重要。諸如,對于企業管理者來說,做到對流量精確的分類和識別,可以對網絡資源進行精準管理、資源有效再利用和提供個性化服務起到很好的作用。同時對于企業,能節省網絡資源不必要的開支也是非常的重要。流量分類也是網絡安全和流量工程的重要一環。如果能準確的把流量進行分類和識別,不僅對網絡安全和網絡管理服務效率有很大提升,也可以降低系統時間和內存開銷。由于大量的網絡應用涌現,使得網絡環境變得復雜和多樣。流量分類和應用識別在網絡管理、資源分配、按需服務和安全系統等中發揮著重要作用,如服務質量和入侵檢測系統等。如何能準確的對未知流量進行精準的分類,來提高系統資源利用率、網絡資源再分配和給客戶提供個性化服務是一大挑戰。
現有的網絡流量分類方法大都是基于傳統的機器學習技術,分類性能大部分依賴于基于包特征或者基于流統計的設計。由于大量未知應用流量的產生,對網絡資源和系統環境產生一定的影響,目前,隨著未知流量的多變化和復雜化,已存在的分類方法在特征提取模塊和分類算法模塊卻不能達到很好的分類效果;不能精確檢測和識別出未知流量。
發明內容
1.要解決的技術問題
基于現有的網絡流量分類方法大都是基于傳統的機器學習技術,分類性能大部分依賴于基于包特征或者基于流統計的設計。由于大量未知應用流量的產生,對網絡資源和系統環境產生一定的影響,目前,隨著未知流量的多變化和復雜化,已存在的分類方法在特征提取模塊和分類算法模塊卻不能達到很好的分類效果;不能精確檢測和識別出未知流量的問題,本申請提供了一種網絡流量分類方法。
2.技術方案
為了達到上述的目的,本申請提供了一種網絡流量分類方法,所述方法包括如下步驟:
步驟1、采集網絡流量樣本數據;
步驟2、對樣本數據進行預處理,得到樣本數據集;
步驟3、對所述樣本數據集中的樣本數據打標簽,得到標簽數據集;
步驟4、將所述標簽數據集和未知標簽數據集整合,得到混合訓練數據集;
步驟5、對所述標簽數據集的網絡流進行分層協議特征提取,得到特征流數據集;
步驟6、采用聚類算法對所述混合訓練數據集和所述特征流數據集進行訓練建模和測試驗證;
步驟7、輸出分類結果。
可選地,所述步驟1包括如下步驟:
101、選擇數據庫;
102、監控所述數據庫中的已知網絡應用流量和未知網絡應用流量;
103、捕捉所有應用流量信息,采集樣本數據。
可選地,所述步驟1中樣本數據包括已知網絡數據包和網絡日志,所述樣本數據包括未知網絡數據包和網絡日志。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811535347.0/2.html,轉載請聲明來源鉆瓜專利網。





