[發(fā)明專利]一種報文特征提取方法和裝置在審
| 申請?zhí)枺?/td> | 201310389436.X | 申請日: | 2013-08-30 |
| 公開(公告)號: | CN103475537A | 公開(公告)日: | 2013-12-25 |
| 發(fā)明(設計)人: | 陳凱;周異 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26 |
| 代理公司: | 深圳市深佳知識產(chǎn)權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 報文 特征 提取 方法 裝置 | ||
技術領域
本發(fā)明涉及通信技術領域,具體設涉及一種報文特征提取方法和裝置。
背景技術
在統(tǒng)計報文分類領域中,數(shù)據(jù)流的特征采集是一件非常重要的事情,好的特征可以提高識別的精確率和準確度,但是目前的大部分統(tǒng)計報文分類都是基于數(shù)據(jù)流來采集特征的,這樣生成的特征向量往往要涉及報文次序的問題,例如:對同一個數(shù)據(jù)流采集其前五個報文大小,或者是采集前五個報文相鄰到達時間間隔等等,諸如此類的特征信息都將在真實網(wǎng)絡環(huán)境中的亂序,部分流(其中,部分流是相對全流而言的。全流指的是一個數(shù)據(jù)流的所有報文,部分流指的是一條流的部分報文),以及丟包的情況下導致識別準確度大打折扣。
因此,現(xiàn)有技術中缺乏一種報文特征提取方法,以適用于真實網(wǎng)絡環(huán)境中的亂序,部分流以及丟包的情形。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種報文特征提取方法和裝置,能夠忽略數(shù)據(jù)報文次序信息,以適用于真實網(wǎng)絡環(huán)境中的亂序,部分流以及丟包的情形。
第一方面,提供了一種報文特征提取方法,所述方法包括:
接收報文;
對所述接收到的報文提取用于分組的第一特征信息;
根據(jù)所述第一特征信息,將所述接收的報文分組,歸屬于同一組的報文屬于同一條數(shù)據(jù)流;
對所述接收到的報文提取用于識別數(shù)據(jù)流類型的第二特征信息,所述第二特征信息用于識別分組后的數(shù)據(jù)流的類型。
在第一種可能的實現(xiàn)方式中,根據(jù)第一方面,所述第一特征信息為五元組信息,所述五元組信息包括:源端口、目的端口、源IP地址、目的IP地址、傳輸層協(xié)議;
所述根據(jù)所述第一特征信息,將所述接收的報文分組,歸屬于同一組的報文屬于同一條數(shù)據(jù)流,具體包括:
將五元組信息對應相同的報文,劃分為同一組,歸屬于同一組的報文屬于同一條數(shù)據(jù)流。
在第二種可能的實現(xiàn)方式中,結合第一方面,所述對接收到的報文提取用于識別數(shù)據(jù)流類型的第二特征信息,所述第二特征信息用于識別分組后的數(shù)據(jù)流的類型,具體包括:
若報文分組后僅有一組,則所述僅有一組的報文屬于一條數(shù)據(jù)流,對接收到的報文提取用于識別數(shù)據(jù)流類型的第二特征信息,所述第二特征信息用于識別所述一條數(shù)據(jù)流的類型,所述第二特征信息用向量組形式表示為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經(jīng)華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310389436.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





