[發明專利]一種基于機器學習的網絡終端設備識別方法及系統有效
| 申請號: | 201811417265.6 | 申請日: | 2018-11-26 |
| 公開(公告)號: | CN109450733B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 石志凱;張傲;鄒素雯 | 申請(專利權)人: | 武漢烽火信息集成技術有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L29/12;G06N20/00 |
| 代理公司: | 武漢智權專利代理事務所(特殊普通合伙) 42225 | 代理人: | 邱云雷 |
| 地址: | 430074 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 網絡 終端設備 識別 方法 系統 | ||
本發明公開了一種基于機器學習的網絡終端設備識別方法及系統,涉及通信網絡技術領域,該方法包括采集目標區域的流量并解析,得到目標區域中每個IP所產生的流量,將每個IP所產生的流量作為子集,記入第一集合;建立用于記錄設備流量特征的匹配庫,匹配庫中的每個設備依次與第一集合中每個子集的流量進行匹配,匹配成功的子集記入第二集合,未匹配成功的子集記入第三集合;提取第二集合中每個子集對應流量的特征字段作為訓練集,對機器學習分類器進行訓練;使用訓練完成后的機器學習分類器對第三集合中每個子集的流量進行識別,得到第三集合中每個子集對應的設備。本發明能夠完成對于網絡中設備的有效識別。
技術領域
本發明涉及通信網絡技術領域,具體涉及一種基于機器學習的網絡終端設備識別方法及系統。
背景技術
目前針對移動網絡終端的識別主要基于三種方式,IMEI(International MobileEquipment Identity,國際移動設備識別碼)識別、MAC(Medium Access Control,介質訪問控制)地址識別和UA(User Agent,用戶代理)識別(參考文獻:1.張冬梅.移動通信運營業務中移動終端識別的運用[J].科技傳播,2015,7(10):103-104.2.李銀周.移動互聯網中手機終端與流量特征分析[D].北京郵電大學,2014.)。對傳統寬帶接入的網絡終端設備,主要有MAC地址識別和發送探測報文進行指紋識別。綜合方法,利用網絡流量分析挖掘技術(參考文獻:WF-C4.5:WiFi環境下基于C4.5決策樹的手持終端流量識別方法[J].計算機科學,2017,44(S1):270-273.)。
IMEI的識別準確性高且高效可靠,但僅當用戶通過SIM卡認證的方式上網時運營商才能獲取到該信息,而隨著互聯網和終端設備的發展,越來越多的設備通過wifi即可接入互聯網,而不再通過SIM認證方式入網,因此在普適應用場景上,IMEI識別并不滿足。MAC地址前6位是廠家信息,通過其識別也是比較快速且準確率高的方式,但在實際網絡中獲取終端設備的MAC地址比較困難,在多層NAT(Network Address Translation,網絡地址轉換)設備的環境下幾乎無法獲取。利用網絡流量的某些特征進行識別,如UA字段,通過HTTP(HyperText Transfer Protocol,超文本傳輸協議)報文中的User-Agent字段進行識別,可以獲取操作系統、設備信息和瀏覽器等信息,然而,UA字段的格式沒有統一標準,因而使得準確的識別比較困難。發送探測報文的形式僅針對能訪問可達的終端設備,實際應用中對多級的內網結構并不適用。利用采集的流量綜合其他方法進行識別,目前綜合方法沒能準確識別到具體設備類型,而只是識別出一種設備的分類,不能滿足具體的設備識別分析要求。故現有的網絡終端設備識別方法或多或少都存在些缺陷。
發明內容
針對現有技術中存在的缺陷,本發明的目的在于提供一種基于機器學習的網絡終端設備識別方法,能夠完成對于網絡中設備的有效識別。
為達到以上目的,本發明采取的技術方案是:
采集目標區域的流量并解析,得到目標區域中每個IP所產生的流量,將每個IP所產生的流量作為子集,記入第一集合;
建立用于記錄設備流量特征的匹配庫,匹配庫中的每個設備對應的流量特征依次與第一集合中每個子集的流量特征進行匹配,匹配成功的子集記入第二集合,未匹配成功的子集記入第三集合;
提取第二集合中每個子集對應流量的特征字段作為訓練集,對機器學習分類器進行訓練;
使用訓練完成后的機器學習分類器對第三集合中每個子集的流量進行識別,得到第三集合中每個子集對應的設備。
在上述技術方案的基礎上,所述目標區域為待進行網絡終端設備識別的區域。
在上述技術方案的基礎上,所述采集目標區域的流量并解析,得到目標區域中每個IP所產生的流量,具體步驟為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢烽火信息集成技術有限公司,未經武漢烽火信息集成技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811417265.6/2.html,轉載請聲明來源鉆瓜專利網。





