[發(fā)明專利]一種自動化挖掘比特粒度特征的網絡流量分類與應用識別方法有效
| 申請?zhí)枺?/td> | 201510426290.0 | 申請日: | 2015-07-21 |
| 公開(公告)號: | CN105071984B | 公開(公告)日: | 2019-06-14 |
| 發(fā)明(設計)人: | 王秋晨 | 申請(專利權)人: | 王秋晨 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 吳開磊 |
| 地址: | 100096 北京市海淀區(qū)西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動化 挖掘 比特 粒度 特征 網絡流量 分類 應用 識別 方法 | ||
本發(fā)明公開了自動化挖掘比特粒度特征的網絡流量分類與應用識別方法。該方法包括:步驟1,創(chuàng)建指定網絡應用流量的事項數據庫Dold;步驟2,建立指定哈希表Bit?Table,產生新事項數據庫Dnew;步驟3,構建基于Dnew的前綴樹Miner?Tree;步驟4,基于最小支持度和最小置信度的剪枝,形成比特粒度特征;步驟5,基于比特粒度特征的網絡應用流量識別。
技術領域
本發(fā)明涉及網絡流量分類技術,特別涉及一種基于比特粒度的網絡流量分類技術以及自動化挖掘指定應用流量中比特粒度特征的方法。
背景技術
隨著互聯網技術的不斷發(fā)展和網絡用戶的不斷增長,基于特征匹配的網絡流量識別與分類方法由于其準確性和穩(wěn)定性在網絡管理和安全審計等方面發(fā)揮了極其重要的作用,例如包括網絡服務質量優(yōu)化和網絡入侵檢測等。然而,隨著網絡應用在互聯網流量中復雜性和隱蔽性的逐漸增強,傳統(tǒng)的基于字節(jié)粒度特征匹配的網絡流量分類方法逐漸失去其效力。與此同時,隨著網絡應用數目的不斷增長和版本更新的日益頻繁,傳統(tǒng)的依靠人工發(fā)現特征的方法由于耗時耗力而無法及時更新和應用,導致網絡流量的精確分類和應用識別面臨極大的挑戰(zhàn)。因此,研究和實現更加細粒度的基于特征匹配的網絡流量分類與應用識別方法并實現其特征的自動化挖掘,已成為相關學術界和工業(yè)界關注的熱點問題。
關聯規(guī)則,屬于數據挖掘的一個重要課題,用于從大量數據中挖掘出有價值的數據項之間的關系。其中涉及的定義如下:設I = {I1, I2, I3, …, Im}是項(Item)的集合,給定一個事項數據庫D = {T1, T2, T3, …, Tn},其中每個事務項(Transaction)T是I的非空子集,即T ? I,每一個事項都有一個唯一的標識符TID(Transaction ID)對應。關聯規(guī)則是形如X ? Y的蘊涵式,其中X, Y ? I且X ∩ Y = Φ。關聯規(guī)則X ? Y在D中的支持度(support)是D中事務包含X ∩ Y的百分比,即概率P(X ∩ Y);置信度(confidence)是包含X的事務中同時包含Y的百分比,即條件概率P(Y | X)。如果同時滿足最小支持度閾值和最小置信度閾值,則認為關聯規(guī)則是有趣的,這些閾值可提前設定。
發(fā)明內容
本發(fā)明提供了一種基于比特粒度的網絡流量分類和應用識別方法,并實現了此類特征的自動化挖掘,提高了網絡流量識別與分類的準確性和可靠性。
為實現上述目的,本發(fā)明提供了自動化挖掘比特粒度特征的網絡流量分類方法,包括:
步驟1,創(chuàng)建指定網絡應用流量的事項數據庫Dold;
步驟2,建立指定哈希表Bit-Table,產生新事項數據庫Dnew;
步驟3,構建基于Dnew的前綴樹Miner-Tree;
步驟4,基于最小支持度和最小置信度的剪枝,形成比特粒度特征;
步驟5,基于比特粒度特征的網絡應用流量識別。
優(yōu)選地,步驟1具體包括如下處理:
步驟11,捕獲指定網絡應用的一定數量的網絡流量;
步驟12,底層處理上述步驟11獲取的網絡流量,提取全部網絡流;
步驟13,將上述步驟12得到的每條網絡流格式化為事務項,得到事項數據庫Dold。
優(yōu)選地,步驟12具體包括如下處理:
步驟121,網絡流量數據包IP分片重組,得到重組后的IP數據包;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王秋晨,未經王秋晨許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510426290.0/2.html,轉載請聲明來源鉆瓜專利網。





