[發明專利]一種基于PCA和XGBoost融合的業務類型識別方法在審
| 申請號: | 202111202293.8 | 申請日: | 2021-10-15 |
| 公開(公告)號: | CN114048795A | 公開(公告)日: | 2022-02-15 |
| 發明(設計)人: | 劉旭;胡俊華;朱曉榮;楊龍祥;朱洪波;江婷 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 朱楨榮 |
| 地址: | 210000 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 pca xgboost 融合 業務 類型 識別 方法 | ||
本發明公開了一種基于PCA和XGBoost融合的業務類型識別方法,包括以下步驟:步驟S1、采集帶有標簽的網絡流量數據集,網絡流量數據集的業務類型包括HTTP、NTP、DNS、QQ、微信、視頻和郵件;步驟S2、對步驟S1中的網絡流量數據集進行數據清洗和特征提取,從而得到含有多維特征的網絡流量數據集;步驟S3、利用主成分分析特征降維的方法將步驟S2中的多維特征簡化成低維特征,得到帶標簽的低維數據集;步驟S4、得到訓練好的極限梯度提升XGBoost分類模型;步驟S5、將待測的網絡流量數據集輸入到步驟S4中的極限梯度提升XGBoost分類模型,得到業務類型分類結果。本發明不僅可以降低識別方法的復雜度,同時還能夠提高對業務類型識別的精度。
技術領域
本發明涉及通信網絡技術領域,特別是一種基于PCA和XGBoost融合的業務類型識別方法。
背景技術
隨著信息技術的不斷發展,互聯網流量規模也在逐年增大,網絡新業務層出不窮。雖然這大大促進了我們社會的進步與發展,這些新業務的普及也為電信運營商吸納了大量的客戶資源,但是網絡中包含了各種各樣的加密流量,對網絡的底層流量模型和上層應用模式產生了很大的沖擊,而為了提高網絡管理、改善網絡服務、保障網絡環境安全,有效地識別各類應用業務的加密流量,從而構建“可運營、可管理”的網絡成了現在一個關鍵的研究方向。
傳統的業務類型識別方法有基于端口的流量識別方法和基于深度包檢測(DPI)的流量識別方法。基于端口的流量識別是通過TCP/UDP數據包報頭中的已知端口號對網絡流量進行分類,最初,這種方法對于實時流量分類非常有效且易于實現,但是,如今各種網絡應用程序并未使用眾所周知的端口來避免被檢測到,而且某些網絡應用程序在使用時可能使用動態端口號。因此,現在基于端口的流量分類不能產生真實的結果,分類精度不高。而基于深度包檢測(DPI)的流量識別方法,本質上是一種數據報文過濾技術,DPI除了支持L2層數據鏈路層、L3層網絡層、L4層傳輸層的報文首部解析之外,還增加了對L7層應用層有效載荷的解析,可以識別各種應用類型及其內容。但是由于目前大多數業務使用各種加密技術來禁止對包有效載荷進行檢查,因此深度包檢測(DPI)的分類精度也不是很高。當前的趨勢是使用機器學習的方法來進行IP流量分類。
近年來,基于機器學習的人工智能技術在計算機視覺、自然語言處理、語音識別、圖像醫療等方面取得了矚目的成就,在很多領域的表現都遠遠優于傳統解決方案。這充分彰顯了機器學習在處理分類任務時的科學性以及有效性,機器學習和數據挖掘技術也逐漸在網絡空間安全領域得到應用與發展,因此機器學習技術也為解決傳統方法解決的加密流量分類問題提供了可能性。傳統的業務類型識別方法無法識別加密流量且存在識別的準確率較低等問題。
發明內容
本發明所要解決的技術問題是克服現有技術的不足而提供一種基于PCA和XGBoost融合的業務類型識別方法,不僅可以降低識別方法的復雜度,同時還能夠提高對業務類型識別的精度。
本發明為解決上述技術問題采用以下技術方案:
根據本發明提出的一種基于PCA和XGBoost融合的業務類型識別方法,包括以下步驟:
步驟S1、采集帶有標簽的網絡流量數據集,網絡流量數據集的業務類型包括HTTP、NTP、DNS、QQ、微信、視頻和郵件;
步驟S2、對步驟S1中的網絡流量數據集進行數據清洗和特征提取,從而得到含有多維特征的網絡流量數據集;
步驟S3、利用主成分分析特征降維的方法將步驟S2中的多維特征簡化成低維特征,得到帶標簽的低維數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111202293.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:底吹風口的布置方法及底吹轉爐
- 下一篇:新能源場站儲能配置方法及裝置





