[發明專利]一種流量監測方法、裝置、設備及介質有效
| 申請號: | 202110416100.2 | 申請日: | 2021-04-19 |
| 公開(公告)號: | CN112995063B | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 李錕 | 申請(專利權)人: | 北京智源人工智能研究院 |
| 主分類號: | H04L12/851 | 分類號: | H04L12/851;H04L12/24;H04L12/26;H04L12/46;G06K9/62;G06N5/00 |
| 代理公司: | 北京辰權知識產權代理有限公司 11619 | 代理人: | 谷波 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 流量 監測 方法 裝置 設備 介質 | ||
本公開涉及一種流量監測方法、裝置、介質及設備,所述方法包括:在網絡中抓取預設時長的網絡流量并存儲進數據庫中;對所述數據庫中的流量數據進行特征提取得到特征數據;對所述特征數據進行特征篩選得到篩選后的數據;利用預設的模型對所述篩選后的數據進行分類。本公開通過建立增量式數據庫為系統增加了增量式學習能力,使得系統能夠及時更新機器學習算法,學習新的VPN流量特征,增加檢測準確性。利用特征構建程序對收集到的網絡流量進行特征構建,實現特征提取自動化,并且得到固定格式的特征,在模型訓練和線上運行時,保證格式的統一性,方便模型后續流程的流暢。
技術領域
本公開涉及互聯網技術領域,更為具體來說,本公開涉及一種流量監測方法、裝置、設備及介質。
背景技術
近年來,由于網絡服務質量等機制的建立,網絡流量分類技術受到了極大的關注。工業界和學術界的許多研究者投入精力研究出了一系列的分類方法,然而,隨著網絡的擴張和創新,每天都會有大量的新應用和服務出現并且不斷更新為網絡流量創造了一個動態的環境。并且,加密技術在網絡中的應用越來越普遍,現在網絡中超過一半的流量都使用了加密技術,這為網絡的通信安全創造了環境,但是為網絡流量的分類帶來了巨大的挑戰。VPN是眾多加密方式中的一種,VPN分為傳統VPN和代理VPN,而且VPN具有多種加密方式,對VPN的加密流量識別也面臨巨大的挑戰,本發明旨在對廣義的VPN加密流量進行識別。
發明內容
為解決現有技術的固定密碼容易導致密碼泄露的安全問題的技術問題。
為實現上述技術目的,本公開提供了一種流量監測方法,所述方法包括:
在網絡中抓取預設時長的網絡流量并存儲進數據庫中;
對所述數據庫中的流量數據進行特征提取得到特征數據;
對所述特征數據進行特征篩選得到篩選后的數據;
利用預設的模型對所述篩選后的數據進行分類。
進一步,所述分類的結果包括:
所抓取的網絡流量屬于非加密的正常網絡流量或VPN加密的網絡流量。
進一步,所述對所述數據庫中的流量數據進行特征提取得到特征數據的過程具體為:
對所述流量數據中的一系列具有相同五元組信息的數據進行提取得到網絡流數據;
對所述網絡流數據的統計特征進行特征提取得到所述特征數據。
進一步,所述統計特征至少包括以下特征之一:
網絡流的提取時間、網絡流的包大小和/或網絡流的包的數量。
進一步,所述對所述數據集進行特征篩選得到篩選后的數據具體包括:
對所述數據集進行方差過濾處理;
對所述方差過濾后的數據利用平均精確率減少和穩定性選擇兩種方式進行特征選擇;
將選擇得到的特征進行融合,得到所述篩選后的數據。
進一步,所述預設的模型具體通過如下方式訓練獲得:
將正常的網絡流量和VPN加密的網絡流量存儲到增量式數據庫中;
從所述增量式數據庫的數據進行特征提取得到作為訓練數據的特征數據;
對所述特征數據進行篩選;
利用梯度提升決策樹GBDT對所述篩選后的特征數據進行處理,得到新的離散特征向量;
把所述離散特征向量輸入邏輯回歸LR模型進行訓練。
進一步地,所述VPN加密的網絡流量包括公有數據集和仿真環境生成的數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智源人工智能研究院,未經北京智源人工智能研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110416100.2/2.html,轉載請聲明來源鉆瓜專利網。





