[發明專利]一種基于機器學習的網絡終端設備識別方法及系統有效
| 申請號: | 201811417265.6 | 申請日: | 2018-11-26 |
| 公開(公告)號: | CN109450733B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 石志凱;張傲;鄒素雯 | 申請(專利權)人: | 武漢烽火信息集成技術有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L29/12;G06N20/00 |
| 代理公司: | 武漢智權專利代理事務所(特殊普通合伙) 42225 | 代理人: | 邱云雷 |
| 地址: | 430074 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 網絡 終端設備 識別 方法 系統 | ||
1.一種基于機器學習的網絡終端設備識別方法,其特征在于,包括以下步驟:
采集目標區域的流量并解析,得到目標區域中每個IP所產生的流量,將每個IP所產生的流量作為子集,記入第一集合;
建立用于記錄設備流量特征的匹配庫,匹配庫中的每個設備對應的流量特征依次與第一集合中每個子集的流量特征進行匹配,匹配成功的子集記入第二集合,未匹配成功的子集記入第三集合;
提取第二集合中每個子集對應流量的特征字段作為訓練集,對機器學習分類器進行訓練;
使用訓練完成后的機器學習分類器對第三集合中每個子集的流量進行識別,得到第三集合中每個子集對應的設備。
2.如權利要求1所述的一種基于機器學習的網絡終端設備識別方法,其特征在于:所述目標區域為待進行網絡終端設備識別的區域。
3.如權利要求2所述的一種基于機器學習的網絡終端設備識別方法,其特征在于:所述采集目標區域的流量并解析,得到目標區域中每個IP所產生的流量,具體步驟為:
S111:對目標區域中設備產生的流量進行采集;
S112:利用流量解析工具對采集的流量解析,所述流量解析工具為bro或wiresshark;
S113:解析后得到設備間的連接信息以及連接協議,并得到目標區域中每個IP所產生的流量。
4.如權利要求3所述的一種基于機器學習的網絡終端設備識別方法,其特征在于:所述將每個IP所產生的流量作為子集,記入第一集合,具體為:
S121:對于目標區域中的每個IP,按照網段進行分類;
S122:獲取每個分類中的內網IP所產生的流量,按照TCP連接或UDP連接,進行流量分類,將分類后的流量作為子集,記入第一集合。
5.如權利要求1所述的一種基于機器學習的網絡終端設備識別方法,其特征在于:所述匹配庫中的每個設備依次與第一集合中每個子集的流量進行匹配,具體為:匹配庫中的每個設備流量特征,依次與第一集合中每個子集對應流量的HTTP連接協議的User-agent字段進行匹配。
6.如權利要求1所述的一種基于機器學習的網絡終端設備識別方法,其特征在于:所述特征字段包括TCP/UDP連接的連接時長、源端有效負載字節數、目標端有效負載字節數、數據包丟失的字節數、源端發送的數據包數量和目標端發送的數據包數量,以及HTTP連接的從客戶端傳輸的數據的實際未壓縮內容大小和從服務器傳輸的數據的實際未壓縮內容大小。
7.如權利要求1所述的一種基于機器學習的網絡終端設備識別方法,其特征在于:當得到第三集合中每個子集對應的設備后,即完成對于目標區域中設備的識別,所述目標區域中需識別的設備包括第二集合中每個子集的流量所對應的匹配庫中的設備,以及第三集合中每個子集對應的設備。
8.一種基于機器學習的網絡終端設備識別系統,其特征在于,包括:
采集模塊,其用于采集目標區域的流量并解析,得到目標區域中每個IP所產生的流量,將每個IP所產生的流量作為子集,記入第一集合;
匹配模塊,其用于建立用于記錄設備流量特征的匹配庫,匹配庫中的每個設備對應的流量特征依次與第一集合中每個子集的流量特征進行匹配,匹配成功的子集記入第二集合,未匹配成功的子集記入第三集合;
訓練模塊,其用于提取第二集合中每個子集對應流量的特征字段作為訓練集,對機器學習分類器進行訓練;
識別模塊,其用于使用訓練完成后的機器學習分類器對第三集合中每個子集的流量進行識別,得到第三集合中每個子集對應的設備。
9.如權利要求8所述的一種基于機器學習的網絡終端設備識別系統,其特征在于:所述目標區域為待進行網絡終端設備識別的區域。
10.如權利要求8所述的一種基于機器學習的網絡終端設備識別系統,其特征在于:當得到第三集合中每個子集對應的設備后,即完成對于目標區域中設備的識別,所述目標區域中需識別的設備包括第二集合中每個子集的流量所對應的匹配庫中的設備,以及第三集合中每個子集對應的設備。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢烽火信息集成技術有限公司,未經武漢烽火信息集成技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811417265.6/1.html,轉載請聲明來源鉆瓜專利網。





