[發明專利]一種未知應用層協議自動分析方法有效
| 申請號: | 200910193469.0 | 申請日: | 2009-10-30 |
| 公開(公告)號: | CN101707532A | 公開(公告)日: | 2010-05-12 |
| 發明(設計)人: | 余順爭 | 申請(專利權)人: | 中山大學 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L29/08;G06F17/30 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 禹小明;邱奕才 |
| 地址: | 510275 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 未知 應用 協議 自動 分析 方法 | ||
1.一種未知應用層協議自動分析方法,其特征在于:
包括對未知應用層數據所進行的采集過程和對采集到的未知應用層數據所 進行的分析過程;
所述采集過程是對網絡的主干、出入口和/或數據流的匯聚點的每個數據流 進行識別并采集未知應用層協議的數據,具體為先建立已知應用的自動機或者 正則表達式,將所述自動機或者正則表達式用于在線識別各種已知的應用,并 把不能識別的應用所對應的應用層數據保存到磁盤;
所述分析過程具體包括如下步驟:
a、對未知應用層協議的數據進行聚類分析,從采集的未知應用層數據中提 取數據流流量特征、字符串特征以及各層頭部信息特征,并用這些特征組成特 征向量進行聚類分析,把聚類得到的每個類作為一種未知應用;
b、挖掘未知應用層協議的關鍵詞,采用數據挖掘技術從每種未知應用的數 據中挖掘其協議關鍵詞和頻繁關鍵詞序列;
c、探索未知應用層協議的會話規則,采用屬于同一種未知應用的頻繁關鍵 詞序列構造一棵代表該協議會話規則的前綴樹,前綴樹中的每條連線代表一個 關鍵詞,每條路徑代表一種會話過程;
d、分析未知應用層協議的報文格式,把每個數據包的應用層數據看作一個 字符串,然后對所有字符串進行語法分析,以構造代表該未知應用層協議的報 文格式的自動機或者正則表達式;
e、預測未知應用層協議的狀態轉移關系,采用隱馬爾可夫模型參數估計算 法,以各個流的關鍵詞序列為訓練集,估計該未知應用層協議的狀態轉移概率 矩陣,以及產生包括關鍵詞、字符串長度和編碼方式的觀測值概率分布。
2.根據權利要求1所述的未知應用層協議自動分析方法,其特征在于所述 分析過程還包括對得到的自動機或者正則表達式進行有效性驗證,具體為檢驗 所述的自動機或者正則表達式接受該應用層協議的樣本流的程度,以及拒絕其 它應用層協議樣本流的程度,把經過驗證的自動機或者正則表達式用于在線識 別該應用層協議。
3.根據權利要求1所述的未知應用層協議自動分析方法,其特征在于利用 得到的未知應用層協議的隱馬爾可夫模型,對所采集的樣本流進行測量,以獲 取所有樣本的正常性分布和每個樣本的正常性,或者發現異常的樣本流。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910193469.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:檢測仿冒網絡設備的方法和裝置
- 下一篇:半剛微波低損耗射頻電纜





