[發明專利]一種網絡流量分類方法、系統、設備及可讀存儲介質在審
| 申請號: | 202211715444.4 | 申請日: | 2022-12-29 |
| 公開(公告)號: | CN116319582A | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 馬小博;瞿建;劉宏桃 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | H04L47/2441 | 分類號: | H04L47/2441;H04L47/2483 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 朱海臨 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡流量 分類 方法 系統 設備 可讀 存儲 介質 | ||
本發明公開了一種網絡流量分類方法、系統、設備及可讀存儲介質,本發明無須對流量樣本開展剪裁、對齊等人工定制化操作,直接將異構、混雜的流量樣本經過向量化后作為輸入,保留了樣本的異構特征,并自動從樣本中學習特征,避免了“輸入定制化”導致的特征損失,通過層次化結構與深度學習進行融合,將流量結構嵌入神經網絡結構中,能夠自動提取各種結構的流量樣本特征,解決了流量樣本“結構不可知”問題。由于具備對異構流量樣本輸入的自動處理和特征學習能力,本發明顯著降低了人工對樣本的定制化預處理操作,避免了樣本剪裁、對齊導致的特征損失,因此能夠高效、精準的對多種流量分類任務進行識別。
技術領域
本發明屬于網絡安全與流量分析領域,尤其涉及到一種網絡流量分類方法、系統、設備及可讀存儲介質。
背景技術
近年來,互聯網各式各樣攻擊層出不窮。網絡流量分類作為保護網絡安全的重要基石之一,能夠廣泛應用于設備識別、異常識別、入侵檢測等相關領域。雖然深度學習因其強大的特征自學習能力,被廣泛應用于網絡流量分類領域,但仍然面臨流量樣本異構性、混雜性引發的“輸入定制化”和“結構不可知”兩大挑戰。
輸入定制化挑戰廣泛存在于基于深度學習的流量分類問題中。對于大多數深度學習神經網絡結構來說,其輸入可以表示為n維歐式空間中的一段向量。但流量數據結構復雜,且長度不同,無法直接輸入現有的神經網絡。現有方法采用專家經驗的流量輸入定制,依賴于不同程度的流量裁剪與特征提取,沒有充分發揮深度學習的特征學習能力,因此產生了輸入定制化挑戰。
流量數據的天然結構特征形成了結構不可知挑戰。對于流量來說,天然存在著數據包、流的概念,對于分類算法來說,需要同時注意到數據包與數據包之間的關系以及流與流之間的關系,目前的深度學習方法并沒有做到這一點,所以導致現有方法無法準確的實現網絡流量的有效分類,不利于網絡的安全環境,對實用性帶來了極大限制。
發明內容
本發明的目的在于提供一種網絡流量分類方法、系統、設備及可讀存儲介質,以克服現有方法無法準確的實現網絡流量的有效分類的問題,本發明能夠高效、快速、精準的對多種流量分類任務進行識別。
一種網絡流量分類方法,包括以下步驟:
S1,將每個數據包轉化為一個固定維度的數據包向量;
S2:將每條流所包含的數據包向量序列轉化為一個固定維度的流向量;
S3:將每個流量樣本所包含的多個流向量轉化為一個樣本向量;
S4:利用多層全連接神經網絡對樣本的特征向量采用Softmax函數進行歸一化處理,得到計算樣本的分類概率。
優選的,將獲取的每個數據包轉化為一個固定維度的數據包向量,輸入流量樣本輸出處理后的流量樣本,記為
優選的,將每個數據包按照該數據包的大小和時間進行編碼,作為數據包向量;或者,將數據包的每個字節作為一個特征維度進行編碼,進而生成數據包向量。
優選的,若數據包大小不足,則使用零向量在尾部進行數據填充,使得每個數據包向量維度相同。
優選的,利用數據包到流的映射神經網絡模塊將每條流的數據包向量轉為該流的特征向量,數據包到流的映射神經網絡模塊記為F1(·);F1(·)輸入一個X(0)中的流fi′,i∈[0,n),輸出一個代表了該流的特征向量fi(1);對X(0)中所有的流均進行F1(·)運算后,數據包到流的映射神經網絡模塊最終輸出為X(1),X(1)=[f1(1),f2(1),…,fn(1)]。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211715444.4/2.html,轉載請聲明來源鉆瓜專利網。





