[發明專利]一種基于深度學習的網絡加密流量識別方法、裝置及設備有效
| 申請號: | 202110439430.3 | 申請日: | 2021-04-23 |
| 公開(公告)號: | CN113132397B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 舒志旭;吉秉彧;黃浩;聶小璠 | 申請(專利權)人: | 信陽農林學院 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;G06N3/0442;G06N3/0464;G06N3/045;G06N3/048;G06N3/0895;G06F18/2415 |
| 代理公司: | 蘇州國卓知識產權代理有限公司 32331 | 代理人: | 江舟 |
| 地址: | 464000 河南省*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 網絡 加密 流量 識別 方法 裝置 設備 | ||
本發明公開一種基于深度學習的網絡加密流量識別方法、裝置及設備,屬于計算機技術領域,特別涉及一種基于深度學習的網絡加密流量識別方法,包括:對移動流量數據進行預處理操作,得到預處理數據;對所述預處理數據進行數據歸一化處理,對數據歸一化處理后的數據進行卷積操作,采用線性流函數作為激活函數對得到的卷積結果計算,并對得到的計算結果進行分類,得到分類結果,本發明通過對預處理后的數據進行歸一化操作,再進行卷積操作,最終進行分類識別,能夠彌補現有技術中只針對傳統互聯網以及PC端產生的流量進行流量識別的問題,本發明能夠對移動流量、以及加密的流量進行分類識別,處理速度快、分類結果精度高。
技術領域
本發明屬于計算機技術領域,特別涉及一種基于深度學習的網絡加密流量識別方法、裝置及設備。
背景技術
目前互聯網上會存在海量的網絡流量數據信息,準確的流量分類是網絡基本任務的前提。然而在現有技術中,由于流量的豐富性和多樣性,以及,除此之外,越來越多的應用已經開始應用安全協議,如HTTPS、SSH、SSL等,對網絡流量進行加密,以保護用戶的隱私;再就是一些基本信息,如流量或流量持續時間,由于隱私協議和法律的原因,現在不易獲取,導致流量分類變得越來越具有挑戰性。簡單地說,如何在沒有私有信息的情況下實現高質量的流量識別,對網絡的安全性和服務質量有著重要的影響。
流量分類是互聯網建立以來其安全領域的重大分支,而流量分類指的是將流量數據與產生該流量數據的具體應用程序或者應用程序類型聯系起來,以得到優先處理、保護或者組織某些流量的效果,識別特定應用產生的流量,也稱之為流量識別。本發明人經研究發現,現有技術中,在進行網絡流量分類的過程中,通常是針對傳統互聯網以及PC端產生的流量,不能夠針對移動流量進行分類識別。
發明內容
為了至少解決上述技術問題,本發明提供了一種基于深度學習的網絡加密流量識別方法、裝置及設備。
根據本發明第一方面,提供了一種基于深度學習的網絡加密流量識別方法,包括:
對移動流量數據進行預處理操作,得到預處理數據;
對所述預處理數據進行數據歸一化處理,對數據歸一化處理后的數據進行卷積操作,采用線性流函數作為激活函數對得到的卷積結果計算,并對得到的計算結果進行分類,得到分類結果。
進一步的,
所述對移動流量數據進行預處理操作,得到預處理數據,包括:
從移動流量數據中獲取消息的起始行和頭部域作為有效數據,轉換為標準化矩陣;
將標準化處理得到的標準化矩陣進行轉換操作,即將字符轉換成類圖片格式的二維數值矩陣,得到預處理數據。
進一步的,
所述對移動流量數據進行預處理操作,得到預處理數據,包括:
從移動流量數據中獲取所有流量的消息頭部及消息實體,組合使用所有流量的消息頭部和實體作為待標準化數據,對所述待標準化數據除去不同組成成分之間的回車換行符進行標準化數據處理;
對得到的標準化處理結果進行類圖像轉換,得到預處理數據。
進一步的,
所述對所述待標準化數據除去不同組成成分之間的回車換行符進行標準化數據處理,包括:
對待標準化處理數據的每一行,若行字符小于矩陣的行元素數量,則使用相應數量的字符補;若行字符數大于等于行元素數量,則丟棄多余字符;
若行數不足,則使用每行若干個NUL字符補充相應行數;若行數大于等于行數,則丟棄多余行數。
進一步的,
所述對預處理數據進行數據歸一化處理,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于信陽農林學院,未經信陽農林學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110439430.3/2.html,轉載請聲明來源鉆瓜專利網。





