[發明專利]半監督網絡流量分類方法有效
| 申請號: | 201910161343.9 | 申請日: | 2019-03-04 |
| 公開(公告)號: | CN109831392B | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 陳雙武;李檀;楊堅;姚振;陳翔 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | H04L12/851 | 分類號: | H04L12/851 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;鄭哲 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 監督 網絡流量 分類 方法 | ||
1.一種半監督網絡流量分類方法,其特征在于,包括:
預先使用一定數量的網絡流量數據無監督的訓練特征提取模塊,以及使用若干有標簽網絡流量數據和一定數量的無標簽網絡流量數據無監督的訓練半監督流量分類模塊;
利用訓練好的特征提取模塊從原始網絡流量數據中提取隱含表達特征,再利用訓練好的半監督流量分類模塊,基于提取到的隱含表達特征對相應原始網絡流量數據進行分類;
其中,采用變分自動編碼器作為特征提取模塊,變分自動編碼器的目標是實現樣本重構;對特征提取模塊進行訓練的目的是最小化重構誤差;所述特征提取模塊包括:第一編碼器與第一解碼器;所述第一編碼器將原始網絡流量數據從高維空間映射至低維的特征空間;所述第一解碼器將數據從低維的特征空間重構至高維空間;
所述半監督流量分類模塊認為所有網絡流量都是由兩部分變量共同生成:流量數據類型變量和其他隱含變量;所述半監督流量分類模塊包括:第二編碼器與第二解碼器;所述第二編碼器的輸入為隱含表達特征,輸出為流量數據類型變量和其他隱含變量;所述第二解碼器輸入為流量數據類型變量和其他隱含變量,輸出為重構的隱含表達特征;優化第二編碼器與第二解碼器需要構造模型的變分下界,進而采用SGVB方法進行梯度下降優化求取參數的最優值;訓練半監督流量分類模塊時,分別針對有標簽網絡流量數據和無標簽網絡流量數據構造其優化目標函數。
2.根據權利要求1所述的一種半監督網絡流量分類方法,其特征在于,所述第一編碼器為概率編碼器,其輸入為原始網絡流量,輸出為關于隱含表達特征的后驗概率分布,定義為表達特征分布;
將網絡流量數據建模為如下集合形式:(X,Y)={(x1,y1),(x2,y2),...,(xN,yN)},其中表示第i條網絡流量數據,N網絡流量數據總數,yi∈{1,...,L}表示第i條網絡流量數據的類型,第i條網絡流量數據隱含表達特征記為zi;
選擇高斯分布N(.)作為隱含表達特征的后驗概率分布的約束形式:
qφ(zi|xi)=N(zi|μφ(xi),diag(σ2(xi)))
概率編碼器使用深度神經網絡建立,輸入為網絡流量數據xi,輸出為高斯分布的參數,高斯分布的均值μφ(xi)與方差diag(σφ2(xi)均為關于網絡流量數據xi和概率編碼器參數φ的函數。
3.根據權利要求2所述的一種半監督網絡流量分類方法,其特征在于,所述第一解碼器為概率解碼器,其輸入為網絡流量數據隱含表達特征zi,輸出為重構后的網絡流量數據概率解碼器的表達形式為:
其中,是一個似然函數,使用深度神經網絡建立,所述似然函數為網絡流量數據隱含表達特征zi與概率解碼器參數θ的函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910161343.9/1.html,轉載請聲明來源鉆瓜專利網。





