[發(fā)明專利]一種基于單向突發(fā)流量特征的加密流量精細(xì)化分類方法有效
| 申請?zhí)枺?/td> | 202011206807.2 | 申請日: | 2020-11-03 |
| 公開(公告)號: | CN112329839B | 公開(公告)日: | 2022-02-08 |
| 發(fā)明(設(shè)計)人: | 沈蒙;高振波;祝烈煌;孫天藝;劉星彤 | 申請(專利權(quán))人: | 北京理工大學(xué) |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京正陽理工知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11639 | 代理人: | 張利萍 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 單向 突發(fā) 流量 特征 加密 精細(xì) 化分 方法 | ||
1.一種基于單向突發(fā)流量特征的加密流量精細(xì)化分類方法,其特征在于,包括以下步驟:
步驟1:從互聯(lián)網(wǎng)單向流量中,提取單向突發(fā)流量序列,具體如下:
單向突發(fā)流量a被定義為與HTTP報文的一個片段相對應(yīng)的數(shù)據(jù)包的序列;給定單向流P,單向突發(fā)流量序列B定義為單向流P中所有單向突發(fā)流量長度的序列;
步驟1.1:從數(shù)據(jù)包中解析構(gòu)造單向突發(fā)流量特征的元信息;
首先,從網(wǎng)絡(luò)中獲取一條單向流P,P中包含K個數(shù)據(jù)包:P=(p1,p2,…,pi,…,pK),其中pi為第i個數(shù)據(jù)包;
然后,解析每個數(shù)據(jù)包獲取構(gòu)造單向突發(fā)流量特征的元信息,其中,pi.l表示TCP有效載荷的長度、pi.n表示TCP有效載荷中TLS記錄頭部的個數(shù)、pi.r包含了pi.n個長度值的數(shù)組,其中,每個值為TLS記錄頭部的長度加上TLS記錄頭部中長度字段值;
步驟1.2:計算單向突發(fā)流量序列B;
在TLS的實(shí)現(xiàn)中,TLS記錄大小是一個重要的參數(shù),根據(jù)TLS記錄大小的不同,單向突發(fā)流量序列B計算分為兩種:
第一種:TLS記錄大小超過最大報文段長度(MSS),在這種情況下,每個數(shù)據(jù)包含有1個或者0個TLS記錄頭部;遍歷P中每一個數(shù)據(jù)包pi,并依次將pi.r中pi.n個長度值加入到單向突發(fā)流量序列B中;
第二種:TLS記錄大小小于最大報文段長度,在這種情況下,每個數(shù)據(jù)包含有0個、1個甚至多個TLS記錄頭部;假設(shè)當(dāng)前遍歷到數(shù)據(jù)包pi時,記seg為在后續(xù)TCP有效載荷中剩余TLS記錄的長度,a′表示當(dāng)前正在計算的單向突發(fā)流量;首先,將pi.r中pi.n個長度值的總和加到seg和a′上,然后seg減去當(dāng)前TCP有效載荷的長度pi.l,得到在后續(xù)TCP有效載荷中剩余TLS記錄的長度;如果seg不等于0,則當(dāng)前單向突發(fā)流量a′尚未結(jié)束,如果seg等于0,則當(dāng)前單向突發(fā)流量a′結(jié)束,并將a′加到單向突發(fā)流量序列B中;
步驟2:構(gòu)建不含全連接層的卷積神經(jīng)網(wǎng)絡(luò);
其中,卷積層的層數(shù)為e,并且最后一層卷積核的數(shù)量等于要分類的數(shù)量;由于神經(jīng)網(wǎng)絡(luò)中沒有全連接層,所以它不需要固定長度的數(shù)據(jù)作為輸入,為了節(jié)省內(nèi)存,設(shè)置一個長度閾值N,如果序列長度超過閾值N,則截取原始輸入的前N個元素;
步驟3:將步驟1得到的單向突發(fā)流量序列,輸入到步驟2中的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練;
步驟4:使用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)對未知流量分類,即,從單向流量中提取單向突發(fā)流量序列,并輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,最終得到預(yù)測結(jié)果。
2.如權(quán)利要求1所述的一種基于單向突發(fā)流量特征的加密流量精細(xì)化分類方法,其特征在于,步驟3的實(shí)現(xiàn)方法如下:
步驟3.1:設(shè)F∈RD×T為e層卷積層的輸出,即輸入的單向突發(fā)流量序列B的特征表示;D是卷積核的數(shù)量,等于要分類的類別數(shù);T是特征圖的長度;第一個卷積層在下標(biāo)t處的等式如下:
其中,C表示在長度為N的單向突發(fā)流量序列B上使用長度為3的濾波器WB、偏置參數(shù)b和非線性函數(shù)ReLU的卷積結(jié)果;
步驟3.2:使用全局平均池化層進(jìn)行分類;
全局平均池化層接受e層卷積的輸出,并在時間維度上平均每個特征圖,如式(2)所示:
其中,V是全局平均池化層的輸出;β表示第β個特征圖,j表示第β個特征圖的下標(biāo);
最后,將softmax分類器應(yīng)用于V上,如式(3)所示:
其中,WV是要訓(xùn)練的參數(shù),是單向突發(fā)流量序列B被預(yù)測為每個類的概率;
步驟3.3:定義損失函數(shù)的定義;使用交叉熵?fù)p失函數(shù)來計算預(yù)測值與標(biāo)簽yi之間的損失,如式(4)所示:
其中,標(biāo)簽yi采用獨(dú)熱碼編碼,|X|是模型輸入X的數(shù)量;如果yij是1,則I(yij=1)=1,否則為0;使用Adam優(yōu)化器,將訓(xùn)練過程中的損失降到最低。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京理工大學(xué),未經(jīng)北京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011206807.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





