[發明專利]一種基于非因果時間卷積神經網絡的加密流量分類方法在審
| 申請號: | 202011526821.0 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112686287A | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 陸菲菲;張魯飛;濮小川;陳浩;吳東;孫茹君;曾明勇;王宇;李祥;錢磊 | 申請(專利權)人: | 無錫江南計算技術研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;H04L29/06 |
| 代理公司: | 蘇州創元專利商標事務所有限公司 32103 | 代理人: | 王健 |
| 地址: | 214038 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 因果 時間 卷積 神經網絡 加密 流量 分類 方法 | ||
本發明公開一種基于非因果時間卷積神經網絡的加密流量分類方法,包括以下步驟:對網絡流量進行預處理,形成以會話為單位切分的流量數據;構建基于非因果時間卷積神經網絡的分類模型:所述基于非因果時間卷積神經網絡的分類模型包括若干個非因果卷積殘差塊、全連接層和用于輸出分類結果的Softmax分類器層;所述非因果卷積殘差塊由兩層空洞卷積構成;在每個空洞卷積層后連接權重歸一化層和激活層,并使用ReLU函數作為激活函數;在跨越連接中,使用1*1卷積;最后,將若干殘差塊堆疊組合后連接全連接層和分類層。本發明擴大了卷積核的作用域和特征點的感受野,可確保全局信息不被遺漏,能夠顯著提升分類效果。
技術領域
本發明涉及一種基于非因果時間卷積神經網絡的加密流量分類方法,屬于互聯網技術與深度學習技術領域。
背景技術
網絡數據協議識別(亦即流量分類)主要基于三個層面:以包為單位的流量分類主要關注數據包的特征及其到達過程、延遲和丟包率等;以流為單位的流量分類,依據收發方地址和應用協議劃分,關注流的到達過程、到達間隔及其局部特性等;以主機為單位的流量分類主要關注主機對之間的應用流量。這三個層面關注的內容從數據包到數據流再到主機,粒度依次增大。
分組網絡的發展使得以流為單位的流量分類方法逐漸成為研究熱點,在流分類技術中,基于統計特征的流分類方法一直以來都是應用最為廣泛的方法。然而,這種方法要求預先提取并計算出一組網絡數據流的特征,如流持續時間、每秒流比特數等,并根據這組特征數據選取合適的算法及模型進行分類。其缺點主要體現在:第一,需要依靠專業領域知識選取合適的分類模型,進行模型訓練,同時優化模型參數;第二,需要依靠專業背景知識與技巧提取合適的流量特征,而特征工程本身又是機器學習全流程中最專業且最難的一個環節,當訓練樣本集非常龐大時,基于統計特征的流分類方法會表現出較差的泛化性能。
深度學習是一種基于表征學習思想的機器學習技術,它通過多層網絡學習得到原始數據的高層特征表示用于分類,而這種端到端的學習方式,不再需要手工設計和提取特征,可以由深度神經網絡直接處理原始數據并自動學習和輸出高層特征,附圖中圖1(a)、(b)分別描述了統計特征模型與表征學習模型的處理流程。
空間特征和時序特征是網絡流量分類領域較為常用的兩類流量特征??臻g特征是指將網絡流量特征轉換為圖像,使用計算機視覺技術基于空間幾何特征進行圖像分類,間接實現網絡流量分類;時序特征是指利用網絡流量數據單元之間的時序關系,提取網絡流量的時序特征,通過序列分析的方法進行流量分類。在一個典型的神經網絡中,每個隱層對上一層傳過來的輸入值進行加權求和并進行非線性變換后,將結果傳遞給下一層,最后一層的輸出值即表示神經網絡學習到的高層特征。
卷積神經網絡在一般神經網絡基礎上進行了局部連接、權值共享和池化等改進,具有很強的空間特征學習能力,已在圖像分類等計算機視覺任務中取得了優異表現;循環神經網絡在隱層神經元上增加了自我連接的權重值,能夠記憶以往時刻的狀態;而基于循環神經網絡改進的長短時記憶網絡進一步增加了遺忘門機制,具有更強的時序特征學習能力,已在機器翻譯等自然語言處理任務中取得了很好的效果。因此,卷積神經網絡和循環神經網絡分別具有良好的空間特征和時序特征學習能力。
目前,在流量分析識別領域,基于深度學習的方法大多采用卷積神經網絡與長短時記憶網絡模型。然而, 長短時記憶網絡雖然在處理序列數據時可以記憶歷史信息,網絡架構模型參數較卷積神經網絡更少,但無法觀測到序列的全局信息,且按時間方向進行回溯導致其在處理長序列時容易面臨梯度消失或者梯度爆炸的情況,此外模型本身也很難實現并行化;2維卷積神經網絡無法撲捉到數據包的時序關系,而1維卷積神經網絡又很難獲取到序列的全局信息。
發明內容
本發明的目的是提供一種基于非因果時間卷積神經網絡的加密流量分類方法,該加密流量分類方法擴大了卷積核的作用域和特征點的感受野,可確保全局信息不被遺漏,能夠顯著提升分類效果。
為達到上述目的,本發明采用的技術方案是:提供一種基于非因果時間卷積神經網絡的加密流量分類方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫江南計算技術研究所,未經無錫江南計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011526821.0/2.html,轉載請聲明來源鉆瓜專利網。





