[發明專利]一種基于多尺度特征注意力的網絡流量分類方法及系統有效
| 申請號: | 202011224892.5 | 申請日: | 2020-11-05 |
| 公開(公告)號: | CN112839024B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 王一鵬;云曉春;賴英旭 | 申請(專利權)人: | 北京工業大學;國家計算機網絡與信息安全管理中心 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;H04L41/14;G06F18/241;G06N3/0464;G06N3/08 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 特征 注意力 網絡流量 分類 方法 系統 | ||
本發明公開了一種基于多尺度特征注意力的網絡流量分類方法及系統,該方法包括訓練階段和分類階段;訓練階段包括:對應用協議的流量樣本進行統一處理;對訓練數據進行學習訓練,構建應用協議分類模型;分類階段包括:采集網絡流量并統一處理;根據訓練階段得到的應用協議檢測模型,對待測流量樣本的應用協議類型進行判別,并輸出判別結果。本發明能夠充分挖掘網絡流量中不同尺度的潛在特征信息,從而形成更具表達能力的特征表示,在網絡應用協議流量分類過程中具有高準確率和強魯棒性。
技術領域
本發明涉及根據報文分組的有效載荷使用深度學習技術對混雜的網絡流量進行自動分類方法及系統,具體涉及一種基于多尺度特征注意力的網絡流量分類方法及系統,屬于網絡流量分類技術領域。
背景技術
網絡流量分類是將網絡流量與其生成的具體應用協議或應用相關聯的過程,其在網絡管理和網絡安全等領域都有著重要應用,如網絡測量,隧道檢測,服務質量(QoS)以及入侵檢測和防御等。具體而言,在網絡管理中,為了獲得更好的服務質量和網絡供應,網絡運營商首先需要將流量分為不同的應用協議。另外,在網絡安全領域中,網絡流量分類是如異常檢測,防火墻和過濾有害流量等活動的第一步。由于這種應用需求,該領域的研究吸引著眾多學術界和工業界的研究關注。值得注意的是,大多數商業解決方案,例如PACE2和NBAR2,通常都依賴于深度數據報文檢查(DPI)進行網絡流量分類,DPI被認為是最準確的流量分類技術之一。在過去的十年中,研究團體探索了多種基于數據報文有效負載的網絡流量分析方法。近年來,受深度學習技術在計算機視覺、機器翻譯和語音識別等多個領域取得巨大成功的推動,一些研究人員開始考慮使用先進的深度學習技術來嘗試更好地解決網絡流量分類問題。然而,設計合適的深度學習模型以實現具備良好分類效率和高分類效率的網絡流量分類仍然是一個非常重要、開放的研究問題。本發明將數據報文的有效負載作為輸入,并嘗試使用新設計的深度學習模型對網絡流量進行更準確和有效的分類。
本發明設計并實現了一個新穎的基于深度學習的網絡流量分類方法及系統,該方法及系統通過提取報文載荷中的多尺度特征并結合注意力機制,從而實現了準確率更優的網絡流量分類。
對于網絡流量分類,現有文獻中提出了幾種使用深度神經網絡模型來分析數據報文有效載荷的方法。典型的深度神經網絡模型報文包括卷積神經網絡(CNN)和遞歸神經網絡(RNN)。然而,現有的基于深度神經網絡的網絡流量分類方法與系統在實際應用過程中存在著兩點局限性:
(1)基于卷積神經網絡(CNN)的現有方法使用固定大小的卷積核,即它們只能提取固定大小的n-gram特征來分析數據報文的有效載荷。n-gram是含有至少n個元素的報文中n個連續元素的報文子序列。使用固定大小的n-gram特征開展流量分類有兩個明顯缺點。首先,某些二進制應用程序應用協議使用的應用協議關鍵字,其大小會小于所選的n-gram大小。因此,使用固定大小的n-gram特征會攜帶其他不必要的冗余信息。其次,某些應用協議可能同時報文含一個字節的應用協議關鍵字和幾個字節的應用協議關鍵字。因此,使用固定大小的n-gram特征無法自適應地選擇不同尺度的n-gram特征以進行魯棒的網絡流量分類。
(2)基于遞歸神經網絡(RNN)的一些方法已被應用于網絡流量分類。但是,RNN的順序性質成為GPU的主要性能瓶頸。當使用RNN處理順序數據時,每個隱藏狀態都需要依賴于先前的隱藏狀態。值得注意的是,雖然GPU具有大量的計算能力,但是RNN的順序性質使得GPU必須等待數據的可用。因此基于RNN的網絡流量分類方法在計算效率和計算復雜性上存在著較大的局限性。
本發明擬解決此前方法或系統存在的兩點技術缺陷。
發明內容
本發明的目的在于設計并實現一種基于多尺度特征注意力的網絡流量分類方法及系統,使得其在網絡流量分類過程中,可以為不同的報文載荷位置自適應地組合不同階的n-gram元素進而形成魯棒的特征表達,以實現高準確、高效率的網絡流量分類。
為實現上述目的,本發明采用的技術方案如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學;國家計算機網絡與信息安全管理中心,未經北京工業大學;國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011224892.5/2.html,轉載請聲明來源鉆瓜專利網。





