[發明專利]一種網絡加密流量分層分類方法及裝置在審
| 申請號: | 202210648545.8 | 申請日: | 2022-06-09 |
| 公開(公告)號: | CN115204258A | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 寧煥生;魏大為;萬月亮 | 申請(專利權)人: | 北京科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波;付忠林 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 加密 流量 分層 分類 方法 裝置 | ||
1.一種網絡加密流量分層分類方法,其特征在于,包括:
獲取通過預設加密網絡協議進行加密的流量數據,對獲取的流量數據進行處理,并將處理后的流量數據存入原始流量數據集中,以供分類器訓練;
對已訓練的網絡協議加密流量分層分類模型進行分析,選擇一個未完成全部加密網絡協議分類的節點,從所述原始流量數據集中提取出相應未分類加密網絡協議所對應的流量數據,以提取出的流量數據構建訓練數據集;
以所述訓練數據集訓練分類模型,并將訓練所得的分類模型參數保存至所述網絡協議加密流量分層分類模型中,同時保存對流量數據的預處理步驟;
基于用戶分類需求,利用已訓練的分層分類模型進行加密流量分類。
2.如權利要求1所述的網絡加密流量分層分類方法,其特征在于,所述對獲取的流量數據進行處理,包括:
對流量數據中包含的本地網絡信息進行混淆,包括:對流量數據中包含的IP地址和MAC地址進行混淆操作;
以流量數據所對應的加密網絡協議為標簽,對流量數據進行打標簽;
存儲網絡加密流量數據到原始流量數據集中。
3.如權利要求1所述的網絡加密流量分層分類方法,其特征在于,以所述訓練數據集訓練分類模型,并將訓練所得的分類模型參數保存至所述網絡協議加密流量分層分類模型中,同時保存對流量數據的預處理步驟,包括:
以所述訓練數據集分別訓練第一分類模型和第二分類模型;
對訓練后的第一分類模型和第二分類模型的分類效果進行評價,選擇其中最佳分類效果的分類模型;并將最佳分類效果的分類模型的模型參數保存至所述網絡協議加密流量分層分類模型中,同時保存對流量數據的預處理步驟。
4.如權利要求3所述的網絡加密流量分層分類方法,其特征在于,所述第一分類模型為基于深度學習的分類模型;所述第一分類模型的訓練過程包括:
從所述訓練數據集中讀取對應的流量數據,并載入相應的標簽數據;
對流量數據進行預處理,得到預處理后的流量數據;其中,預處理過程包括:將網絡會話的前N個包的載荷提取出;按照網絡會話的順序將載荷的前M個字節排列到數組中;對不足長度的會話進行填空補足;組成N*M的輸入數據;
對預處理后的流量數據進行基于深度學習的特征提取,包括:利用卷積神經網絡和循環神經網絡構建網絡協議流量特征提取模型;在特征提取模型后,加入展平層、全連接層,最后加入和標簽數量相等的全連接層,并用softmax激活函數實現針對這部分標簽的分類器;使用預處理后的數據對模型進行訓練;去除全連接層后,獲得協議流量特征提取模型;利用層次聚類模型,對該部分網絡協議數據進行聚類;獲得對該部分協議的弱分類器;
對訓練后的模型進行優化,去除無效的特征提取步驟,得到訓練好的模型。
5.如權利要求3所述的網絡加密流量分層分類方法,其特征在于,所述第二分類模型為基于流量統計特征的分類器;所述第二分類模型的訓練過程包括:
從所述訓練數據集中讀取對應的流量數據,并載入相應的標簽數據;
對流量數據進行預處理,得到預處理后的流量數據;其中,預處理過程包括:根據已存儲的流量統計特征計算方式,計算流量數據的全部統計特征;
從網絡協議分類表中確定當前層分類目標并對流量數據進行重新標記;
隨機選擇一部分流量統計特征加入到已選擇統計特征集合中;
利用隨機森林算法對分類器進行訓練,得到分類模型;
對模型分類效果進行評價,并將當前模型的分類效果與上一階段模型的分類效果進行比較,保留最佳模型,直至預設循環次數。
6.如權利要求1所述的網絡加密流量分層分類方法,其特征在于,所述基于用戶分類需求,利用已訓練的分層分類模型進行加密流量分類,包括:
根據用戶分類需求確定所需要的協議流量種類和分類器層級;
從已訓練分層分類模型中讀取分類模型參數和預處理步驟;
以讀取的預處理步驟對待分類流量作預處理;
按照分層分類模型的順序,依次將預處理后的流量數據送入模型進行分類;
對分類結果進行標記并輸出。
7.一種網絡加密流量分層分類裝置,其特征在于,包括:
網絡協議加密流量分層分類模型訓練模塊,用于:
獲取通過預設加密網絡協議進行加密的流量數據,對獲取的流量數據進行處理,并將處理后的流量數據存入原始流量數據集中,以供分類器訓練;
對已訓練的網絡協議加密流量分層分類模型進行分析,選擇一個未完成全部加密網絡協議分類的節點,從所述原始流量數據集中提取出相應未分類加密網絡協議所對應的流量數據,以提取出的流量數據構建訓練數據集;
以所述訓練數據集訓練分類模型,并將訓練所得的分類模型參數保存至所述網絡協議加密流量分層分類模型中,同時保存對流量數據的預處理步驟;
面向用戶需求的網絡協議加密流量分類模塊,用于:
基于用戶分類需求,利用已訓練的分層分類模型進行加密流量分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京科技大學,未經北京科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210648545.8/1.html,轉載請聲明來源鉆瓜專利網。





