[發(fā)明專利]一種深度學(xué)習(xí)的網(wǎng)絡(luò)流量分類方法在審
| 申請?zhí)枺?/td> | 201610388592.8 | 申請日: | 2016-06-02 |
| 公開(公告)號: | CN107465643A | 公開(公告)日: | 2017-12-12 |
| 發(fā)明(設(shè)計(jì))人: | 徐杰;陳訓(xùn)遜;王博;崔佳;王東安;包秀國 | 申請(專利權(quán))人: | 國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F17/30;G06K9/62 |
| 代理公司: | 北京華仲龍騰專利代理事務(wù)所(普通合伙)11548 | 代理人: | 黃玉玨 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 深度 學(xué)習(xí) 網(wǎng)絡(luò)流量 分類 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)絡(luò)信息安全技術(shù)領(lǐng)域,特別涉及一種基于深度學(xué)習(xí)的網(wǎng)絡(luò)流量分類方法。
背景技術(shù)
隨著信息技術(shù)的蓬勃發(fā)展,種類繁多的互聯(lián)網(wǎng)應(yīng)用產(chǎn)生的大量流量占用了很多網(wǎng)絡(luò)資源,在給服務(wù)質(zhì)量帶來巨大挑戰(zhàn)的同時(shí)也給互聯(lián)網(wǎng)安全產(chǎn)生負(fù)面影響。為了高效地利用網(wǎng)絡(luò)資源并為網(wǎng)絡(luò)管理者提供有效的管控手段,以辨別應(yīng)用層協(xié)議為目的的網(wǎng)絡(luò)流量分類技術(shù)成為近年來的研究熱點(diǎn)問題。在網(wǎng)絡(luò)流量分類的傳統(tǒng)方法中,應(yīng)用最廣的是基于知名端口號(known ports)的流量分類算法、基于特征字匹配的流量分類算法、基于傳輸層行為模式的流量分類算法。但是隨著端口偽造、明文加密等技術(shù)的使用以及網(wǎng)絡(luò)類別環(huán)境差別的增大,上述三種分類方法在現(xiàn)階段已經(jīng)無法滿足對分類的精度要求。機(jī)器學(xué)習(xí)方法不需要對端口進(jìn)行匹配,也不需要解析流量的有效載荷內(nèi)容,同時(shí)不受網(wǎng)絡(luò)環(huán)境等影響就可以對網(wǎng)絡(luò)流量進(jìn)行高精度的分類,故基于機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)流量分類技術(shù)成為近年來的研究熱點(diǎn)問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的缺陷,提供一種基于深度學(xué)習(xí)的網(wǎng)絡(luò)流量分類方法。
本發(fā)明的技術(shù)方案是,一種基于深度學(xué)習(xí)的網(wǎng)絡(luò)流量分類方法,包括如下步驟:
(1)網(wǎng)絡(luò)流量樣本數(shù)據(jù)的獲??;
采用Libpcap庫對網(wǎng)絡(luò)流量進(jìn)行捕獲;
(2)網(wǎng)絡(luò)流量屬性的確定,包括
a.網(wǎng)絡(luò)流量中客戶端端口號統(tǒng)計(jì)分析;
b.網(wǎng)絡(luò)流量中數(shù)據(jù)包平均到達(dá)時(shí)間統(tǒng)計(jì)分析;
c.網(wǎng)絡(luò)流量中包含數(shù)據(jù)包個(gè)數(shù)統(tǒng)計(jì)分析;
(3)網(wǎng)絡(luò)流量樣本標(biāo)記;
采用一種基于端口號及特征字匹配的網(wǎng)絡(luò)流量樣本標(biāo)記算法,該算法先利用IANA的知名端口庫判斷訓(xùn)練樣本中流量的端口號是否為知名端口,再利用特征字匹配技術(shù)將非知名端口的流量樣本進(jìn)行深度解析匹配,對未知流樣本進(jìn)行標(biāo)記;
(4)連續(xù)數(shù)據(jù)的離散化;
利用基于粗糙集的方法對網(wǎng)絡(luò)流量樣本中連續(xù)的數(shù)據(jù)進(jìn)行離散化;
(5)樣本的訓(xùn)練;
采用深度學(xué)習(xí)中的受限玻爾茲曼機(jī),在原始輸入特征中抽取低維高度可區(qū)分的低維特征作為訓(xùn)練模型的輸入,對樣本進(jìn)行訓(xùn)練,使用支持向量機(jī)作為回歸模型。
本發(fā)明的有益效果在于:對紛繁復(fù)雜的網(wǎng)絡(luò)流量資源,能夠滿足高精度的分類要求。
附圖說明
圖1為本發(fā)明的方法流程圖
具體實(shí)施方式
下面,結(jié)合附圖對于本發(fā)明進(jìn)行如下詳細(xì)說明:
流程圖如圖1所示,描述了利用深度學(xué)習(xí)算法對網(wǎng)絡(luò)流進(jìn)行分類的過程。首先從外部網(wǎng)絡(luò)中獲取數(shù)據(jù),之后將數(shù)據(jù)進(jìn)行處理得到用流的屬性向量表示的流數(shù)據(jù)集合,再對流的屬性特征進(jìn)行選擇得到待訓(xùn)練數(shù)據(jù),利用深度學(xué)習(xí)算法進(jìn)行訓(xùn)練得到分類模型,最后利用分類模型對未知樣本進(jìn)行分類。
本發(fā)明主要包括以下步驟:
一是網(wǎng)絡(luò)流量樣本數(shù)據(jù)的獲取。常使用普通的PC機(jī),利用Libpcap庫對網(wǎng)絡(luò)流量進(jìn)行捕獲。
二是流量屬性的確定。樣本數(shù)據(jù)對學(xué)習(xí)模型的穩(wěn)定性、精確性有著至關(guān)重要的作用,而樣本是由網(wǎng)絡(luò)流的各項(xiàng)屬性計(jì)算而來,所以流屬性的確定也就決定了流分類的結(jié)果精度。本發(fā)明采用三種方法進(jìn)行流量屬性確定:1.網(wǎng)絡(luò)流中客戶端端口號統(tǒng)計(jì)分析;2.網(wǎng)絡(luò)流中數(shù)據(jù)包平均到達(dá)時(shí)間統(tǒng)計(jì)分析;3.網(wǎng)絡(luò)流中包含數(shù)據(jù)包個(gè)數(shù)統(tǒng)計(jì)分析。
三是網(wǎng)絡(luò)流樣本的標(biāo)記。本發(fā)明的深度學(xué)習(xí)算法均是有監(jiān)督的學(xué)習(xí)算法,所以機(jī)器學(xué)習(xí)的訓(xùn)練樣本中需要包含樣本的類別信息,即訓(xùn)練時(shí)算法需要事先知道該樣本的類別,在對未知樣本進(jìn)行分類時(shí)可以增大分類模型的精度。本發(fā)明設(shè)計(jì)了一種基于端口號及特征字匹配的網(wǎng)絡(luò)流樣本標(biāo)記算法,該算法先利用IANA的知名端口庫判斷訓(xùn)練樣本中流的端口號是否為知名端口,再利用特征字匹配技術(shù)將非知名端口的流樣本進(jìn)行深度解析匹配,對未知流樣本進(jìn)行標(biāo)記。
四是連續(xù)數(shù)據(jù)的離散化。利用基于粗糙集的方法對網(wǎng)絡(luò)流樣本中連續(xù)的數(shù)據(jù)進(jìn)行離散化。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心,未經(jīng)國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610388592.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:燈槽預(yù)制件(LQ7)
- 下一篇:石英智能手表(S?69)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 無線數(shù)據(jù)卡中的網(wǎng)絡(luò)流量統(tǒng)計(jì)指示裝置
- 網(wǎng)絡(luò)流量回放測試方法及裝置
- 移動(dòng)應(yīng)用網(wǎng)絡(luò)流量聚類方法、計(jì)算機(jī)可讀存儲介質(zhì)和終端
- 移動(dòng)應(yīng)用網(wǎng)絡(luò)流量聚類裝置
- 一種網(wǎng)絡(luò)流量表示的方法及裝置
- 基于網(wǎng)絡(luò)流量多視圖融合的惡意軟件檢測方法及系統(tǒng)
- 一種網(wǎng)絡(luò)流量預(yù)測方法、裝置及電子設(shè)備
- 異常網(wǎng)絡(luò)流量檢測方法、可讀存儲介質(zhì)和終端
- 異常網(wǎng)絡(luò)流量檢測裝置
- 一種網(wǎng)絡(luò)流量分類方法和系統(tǒng)





