[發明專利]基于深度學習的I2P流量識別方法及系統在審
| 申請號: | 202110075899.3 | 申請日: | 2021-01-20 |
| 公開(公告)號: | CN112887291A | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 景全亮;范鑫鑫;畢經平;武超;雷蕾;張永 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L12/24;G06N3/08 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 i2p 流量 識別 方法 系統 | ||
本發明提出一種基于深度學習的I2P流量識別方法及系統。包括將各流量信息轉換為相應的灰度圖像,為之后利用深度學習卷積神經網絡進行流量識別提供模型輸入,以實現快速識別I2P流量的目標。在保證算法準確率的條件下,優化現有I2P流量識別算法的數據預處理流程,減少了現有方法在特征工程階段的工作量。
技術領域
本發明涉及網絡通信中報文識別領域,并特別涉及一種基于深度學習的I2P流量識別方法及系統。
背景技術
近年來,隨著互聯網技術飛速發展,海量信息數據通過互聯網進行傳輸。匿名通信技術作為保護用戶隱私與個人信息數據安全的工具,得到了廣泛關注。匿名通信技術通常利用內容加密、多跳轉發、流量混淆等手段實現通信數據和通信關系的匿名化,保護通信雙方的通信關系與通信內容。
I2P作為當前主流的匿名通信工具,依靠大蒜路由技術實現通信的匿名性。使用大蒜路由技術的通信雙方均使用多跳單向加密隧道進行通信,通信隧道中的每一跳節點只掌握相鄰節點的信息,無法獲知通信雙方的通信關系。目前,I2P報文識別算法多為基于I2P流量包特征、流特征匹配的識別算法。例如《基于I2P的匿名通信協議分析與流量檢測的研究》采用基于載荷長度熵過濾及載荷長度序列過濾的方法來過濾未知流量并識別I2P流量。該方法的核心思路是提取I2P會話中流長度熵特征及載荷序列特征,利用貝葉斯網絡統計學習算法來識別I2P報文。其中,載荷序列特征為I2P會話密鑰交互過程中的流量上下行關系,以↑表示上行網絡數據長度,↓表示下行網絡數據長度,I2P會話建立過程中會出現“↑288↓304↑448↓48”、“↑288↓304↑464↓48”等固定載荷序列。流長度熵特征的計算方法主要有兩步:(1)統計當前會話中各數據包的報文長度,按報文長度,該長度出現次數進行聚合,之后計算某報文長度出現次數占數據包總數的比率p(Ai),例如,A會話中共含20個數據包,長度為334的數據包出現次數為3,則p(A334)=15%,形成當前會話的數據包長度分布;(2)計算會話A與各已識別會話的數據包長度分布的相對熵,公式如下:
若相對熵超過閾值,則標記該會話為I2P會話。
深度學習作為人工智能的核心技術,近年來在計算機視覺、自然語言處理等領域取得巨大成功。基于深度學習的圖像識別系統也得到了廣泛應用,利用深度學習技術識別流量“圖像”的想法也得到了廣泛關注。例如采用LeNet深度學習網絡識別Tor網絡報文,通過改進LeNet神經網絡結構,并根據Tor網絡通信特點提出源ip地址、目的ip地址、源端口、目的端口、傳輸層協議的數據包五元組通信特征來完成Tor流量的識別。
現有方案多基于傳統統計機器學習方法,該類方法往往伴隨著繁瑣、復雜的數據預處理及人工篩選特征過程,在解決實際流量識別問題時,尤其是構建問題特征階段,需要研究人員對該問題具有較為充分的認識。而基于深度學習的流量識別算法在保證識別準確度的前提下,對原始流量的預處理較少,沒有繁瑣的特征提取過程,極大的減少了特征工程階段的工作量。
發明內容
本發明的目的是簡化I2P流量識別過程中繁瑣的數據預處理過程與人工篩選特征的過程,提出了一種基于深度學習的I2P流量識別方法,其中包括:
步驟1、獲取已標記I2P流量類別標簽的流量文件作為訓練數據,提取該訓練數據中數據包的報文字段,得到五元組信息,該五元組信息由該數據包的源IP地址、目的IP地址、源數據端口、目的數據端口及載荷長度組成;
步驟2、判斷該數據包中運輸層的協議類型是否為TCP協議,若是,則按TCP流對數據包的載荷長度進行聚合,否則按由源IP地址、源數據端口、目的IP地址和目的數據端口組成的四元組對數據包的載荷長度進行聚合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110075899.3/2.html,轉載請聲明來源鉆瓜專利網。





