[發明專利]一種加密流量分類方法、系統、設備及可讀存儲介質有效
| 申請號: | 202110437302.5 | 申請日: | 2021-04-22 |
| 公開(公告)號: | CN113095426B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 馬小博;劉東錦;瞿建;卞華峰;王鑫;潘鵬宇;李森 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F18/2431 | 分類號: | G06F18/2431;G06F18/214;G06F18/25;H04L47/2441 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 朱海臨 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 加密 流量 分類 方法 系統 設備 可讀 存儲 介質 | ||
1.一種加密流量分類方法,其特征在于,包括以下步驟:
S1,采用袋外數據對預訓練模型的模型特征進行重要性度量,得到模型特征重要性排序,取模型特征排序結果效果最好的前
預訓練模型具體通過以下方法獲得:
a、采集加密流量樣本集合,加密流量樣本集合中的每一個加密流量樣本為原始流量文件;對原始流量文件進行預處理,分離匿名代理工具產生的流量,篩選有效流,統一流量方向,得到加密流量序列;
b、根據加密流量獲取被動探測特征和主動探測特征,利用獲取的被動探測特征和主動探測特征對隨機森林模型進行訓練,得到預訓練模型;
被動探測特征包括基礎特征
主動探測特征包括遠程主機的whois信息和端口信息;根據數據包的遠程主機IP地址對遠程主機進行掃描得到用于加密流量分類器模型訓練的主動探測特征;
S2,利用有效特征對預訓練模型進行優化訓練,得到最終的加密流量分類器模型,利用加密流量分類器模型進行加密流量的分類。
2.根據權利要求1所述的一種加密流量分類方法,其特征在于,預訓練模型采用樣本集合進行預訓練。
3.根據權利要求1所述的一種加密流量分類方法,其特征在于,原始流量文件包括數據包和唯一的加密流量類型標簽,加密流量序列包括服務器地址、目標端口號、傳輸所用的協議號、流量起止時間、流量上下行字節數和上下行數據包的數目。
4.根據權利要求1所述的一種加密流量分類方法,其特征在于,以得到的加密流量樣本的有效特征序列作為輸入,訓練隨機森林分類模型得到最終分類模型;將待分類的加密流量數據進行預處理得到待分類加密流量序列,將待分類的加密流量數據和待分類加密流量序列輸入最終分類模型中,加密流量分類器模型綜合所有決策樹的獨立判定結果輸出綜合判定結果。
5.一種加密流量分類系統,其特征在于,包括預訓練模塊和分類器模塊,
預訓練模塊用于存儲預訓練模型,并根據袋外數據對預訓練模型的模型特征進行重要性度量,得到模型特征重要性排序,取模型特征排序結果效果最好的前
預訓練模型具體通過以下方法獲得:
a、采集加密流量樣本集合,加密流量樣本集合中的每一個加密流量樣本為原始流量文件;對原始流量文件進行預處理,分離匿名代理工具產生的流量,篩選有效流,統一流量方向,得到加密流量序列;
b、根據加密流量獲取被動探測特征和主動探測特征,利用獲取的被動探測特征和主動探測特征對隨機森林模型進行訓練,得到預訓練模型;
被動探測特征包括基礎特征
主動探測特征包括遠程主機的whois信息和端口信息;根據數據包的遠程主機IP地址對遠程主機進行掃描得到用于加密流量分類器模型訓練的主動探測特征;
分類器模塊根據最終的加密流量分類器模型對輸入的加密流量數據進行分類并輸出分類結果。
6.一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至4任一項所述方法的步驟。
7.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至4任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110437302.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能安全輪胎內支撐裝置及控制方法
- 下一篇:一種光學電子白板散熱裝置





