[發明專利]一種自動化挖掘比特粒度特征的網絡流量分類與應用識別方法有效
| 申請號: | 201510426290.0 | 申請日: | 2015-07-21 |
| 公開(公告)號: | CN105071984B | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 王秋晨 | 申請(專利權)人: | 王秋晨 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 吳開磊 |
| 地址: | 100096 北京市海淀區西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動化 挖掘 比特 粒度 特征 網絡流量 分類 應用 識別 方法 | ||
1.一種自動化挖掘比特粒度特征的網絡流量分類與應用識別方法,其特征在于,包括:
步驟1,創建指定網絡應用流量的事項數據庫Dold;
步驟2,建立指定哈希表Bit-Table,產生新事項數據庫Dnew;
步驟3,構建基于Dnew的前綴樹Miner-Tree;
步驟4,基于最小支持度和最小置信度的剪枝,形成比特粒度特征;
步驟5,基于比特粒度特征的網絡應用流量識別;
將每條網絡流轉換成一項事務項(Transaction),其中每條網絡流的每一個比特轉換成一個項(Item);通過這種方式,每條網絡流對應的事務項共同組成事項數據庫Dold;
所述步驟2具體包括如下處理:
步驟21,根據可用內存建立合適大小的哈希表Bit-Table;
步驟22,計算事項數據庫Dold中每個項的支持度;
步驟23,根據支持度重新排序每個事務項中的所有項的排序,形成新事項數據庫Dnew。
2.如權利要求1所述的方法,其特征在于,所述步驟1具體包括如下處理:
步驟11,捕獲指定網絡應用的一定數量的網絡流量;
步驟12,底層處理上述獲取的網絡流量,提取全部網絡流;
步驟13,將上述得到的每條網絡流格式化為事務項,得到事項數據庫Dold。
3.如權利要求1所述的方法,其特征在于,所述步驟22具體包括如下處理:
步驟221,依次讀取上述產生的事項數據庫Dold中的每個事務項中的每個項,并通過哈希運算將每個項映射到不同的哈希單元;
步驟222,遍歷Dold完成后,得到事項數據庫中每個不同項的支持度,這里支持度即Dold的每個不同項在全部事務項中出現的百分比。
4.如權利要求1所述的方法,其特征在于,所述步驟23具體包括如下處理:
步驟231,再次讀取上述產生的事項數據庫Dold中的每個事務項中的每個項,并檢查每個不同項的支持度;
步驟232,從每個事務項中刪除項的支持度小于已設置的支持度閾值的項;
步驟233,在每個事務項中根據每個項的支持度大小重新排序所有項的位置,由大到小排列;
步驟234,所有新的事務項組成新的事項數據庫Dnew。
5.如權利要求1所述的方法,其特征在于,所述步驟3進一步包括:
構建基于Dnew的前綴樹Miner-Tree,每個事務項的所有項按照已排列的順序依次導入根節點為空的前綴樹,其中每個項占據Miner-Tree的一個節點,不同事務項的完全相同的前X項可共用相同的X個節點,并記錄每個節點在所有事務項中出現的重疊次數,如果節點不存在則建立新的節點分支;通過這種方式,將新事項數據庫Dnew中的所有事務項轉換成Miner-Tree存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王秋晨,未經王秋晨許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510426290.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于對消息進行歸類處理的方法和裝置
- 下一篇:一種網絡設備的管理系統





