[發明專利]一種基于自動機器學習的加密流量協議識別方法及裝置在審
| 申請號: | 202011526966.0 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112671757A | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 陸菲菲;張魯飛;濮小川;吳東;孫茹君;王宇;李祥;錢磊;張昆;陳皖蘇 | 申請(專利權)人: | 無錫江南計算技術研究所 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L12/24;H04L12/26;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州創元專利商標事務所有限公司 32103 | 代理人: | 王健 |
| 地址: | 214038 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自動 機器 學習 加密 流量 協議 識別 方法 裝置 | ||
本發明公開一種基于自動機器學習的加密流量協議識別方法及裝置,所述方法包括以下步驟:對加密流量進行會話切分、匿名化處理、統一數據包長度等數據預處理工作;提取流量樣本的14個流特征;采用自動機器學習方法識別加密流量協議,并輸出結果。本發明提供兩種協議識別的方法,一種通過提取數據的統計特征自動生成最優的機器學習算法、模型并自動優化模型的超參數;另一種僅利用原始加密流量即可自動搜索出適合加密流量分類任務的最優神經網絡結構,兩種方法均可在無需借助人工智能專家智慧的情況下,自動生成優化的機器學習算法與神經網絡模型,并自動優化超參數,實現對加密流量協議的自動分類,從而大大提升加密流量協議識別的準確率和效率。
技術領域
本發明涉及一種基于自動機器學習的加密流量協議識別方法及裝置,屬于網絡通信技術和人工智能技術領域。
背景技術
網絡流量協議識別又稱為網絡流量分類,傳統的網絡流量分類技術可以分為四類,即基于端口識別的方法、基于深度包檢測的方法、基于流量統計的方法和基于流量行為分析的方法。近年來,隨著網絡傳輸安全和用戶隱私保護等需求的迅速增加,加密流量呈現爆發式增長,直接應用傳統的流量分類方法無法對網絡中傳輸的加密流量進行有效區分,給網絡流量分類帶來巨大挑戰。
人工智能技術的發展為加密流量分類領域打開了新思路,目前,主流的加密流量分類技術主要包括基于機器學習的加密流量分類方法和基于深度學習的加密流量分類方法兩類。
基于機器學習的加密流量分類方法通常需要從原始加密流量中提取各項特征,用機器學習模型做分類。研究所使用的特征主要有兩類:流特征,例如流持續時間、每秒流比特數等;包特征,例如包大小、包方向等。然而,傳統機器學習存在以下問題:一是需要人工選擇算法、模型并調參;二是其分類性能依賴于人工選擇的流量特征。
基于深度學習的加密流量分類方法通過構建一個分類模型,直接從原始加密流量中學習特征,避免了人工選擇特征的問題。但由此帶來的問題是:神經網絡模型設計的好壞取決于人們對分類任務的理解及模型設計上的想象力,需要相關研究人員對人工智能領域以及流量分類領域均有著充分的認知,與此同時,在訓練過程中,通過人工不斷地對模型結構及參數進行調整與優化也非常耗費時間。
綜上所述,現有技術的缺點為高度依賴人工智能專家經驗,且模型迭代優化的周期長,業務人員使用神經網絡模型的門檻高。如何有效提高模型篩選與超參調優的速度,從而提升流量分類的準確率和效率是關鍵。
發明內容
本發明的目的是提供一種基于自動機器學習的加密流量協議識別方法及裝置,其可以在不借助人工智能專家智慧的情況下,根據原始加密流量或流量的統計特征自動生成最優的算法、模型并自動優化超參數,實現對加密流量協議的自動分類,大大提升加密流量協議識別的準確率和效率。
為達到上述目的,本發明采用的技術方案是:提供一種基于自動機器學習的加密流量協議識別裝置,包括基礎環境層、AI支撐環境層和自適應協議識別層;
所述基礎環境層包括用于組成系統的基礎軟硬件和各種數據資源;
所述AI支撐環境層用于調度基礎環境層的軟硬件資源,為自適應協議識別層提供支撐,同時對資源使用的情況、生成的算法模型結果進行記錄,為后續的溯源評價提供基礎,具體包括各種人工智能框架、算法庫及模型管理模塊;
所述自適應協議識別層用于提供基于自動機器學習方法的加密流量協議識別服務,包括數據預處理模塊、特征工程模塊和協議識別模塊;
所述數據預處理模塊,用于對加密流量進行采集、清洗、時間戳提取,利用數據包交互的特征切分網絡流量,并將數據集劃分為訓練集和測試集兩部分;
所述特征工程模塊,用于在會話切分的基礎上,對原始加密流量數據進行初步特征提取與標注,為基于機器學習的分類提供特征數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫江南計算技術研究所,未經無錫江南計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011526966.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種硅片轉移裝置
- 下一篇:一種電子價簽管理方法、服務器及計算機可讀存儲介質





