[發明專利]半監督網絡流量分類方法有效
| 申請號: | 201910161343.9 | 申請日: | 2019-03-04 |
| 公開(公告)號: | CN109831392B | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 陳雙武;李檀;楊堅;姚振;陳翔 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | H04L12/851 | 分類號: | H04L12/851 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;鄭哲 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 監督 網絡流量 分類 方法 | ||
本發明公開了一種半監督網絡流量分類方法,包括:預先使用一定數量的網絡流量數據無監督的訓練特征提取模塊,以及使用若干有標簽網絡流量數據和一定數量的無標簽網絡流量數據無監督的訓練半監督流量分類模塊;利用訓練好的特征提取模塊從原始網絡流量數據中提取隱含表達特征,再利用訓練好的半監督流量分類模塊,基于提取到的隱含表達特征對相應原始網絡流量數據進行分類。該方法通過自動提取網絡流量的隱含表達特征,克服了過于依賴人為制定特征的問題;同時,半監督方法僅需要少量有標簽網絡流量數據和大量無標簽網絡流量數據即可構建流量分類器,克服了無法獲取大量可靠數據集的困難。
技術領域
本發明涉及計算機網絡技術領域,尤其涉及一種半監督網絡流量分類方法。
背景技術
隨著大數據時代的到來,新型互聯網應用層出不行,網絡的組成成分也日益復雜。為了能夠更好地實施網絡管理及網絡安全措施,網絡管理者需要對海量的網絡流量類型及其安全等級進行感知。在過去的十幾年中,網絡流量分類方法對優化網絡配置,減少網絡安全風險以及提高用戶服務質量起到了重要作用。
傳統的網絡流量分類方法可以分為以下三類:
基于端口號的方法:該方法的原理是根據IANA(Internet Assigned NumbersAuthority)發布的Service Name and Transport Protocol Port Number Registry中端口號與特定應用的映射表,通過讀取網絡數據包包頭中16位的端口號信息來確定未知流量的類別。這種分類方法原理簡單,只需要在網絡流中確定某個數據包頭的源、目的端口的數值與端口映射表相比較即可,具有較低的時間復雜度,易于實現。但該方法面臨以下問題:有些應用使用動態端口,在數據傳輸中端口不斷變化;端口偽造技術的發展使得一些應用程序使用其他知名端口進行數據傳輸,進而造成誤判;一些P2P應用在端口號中隨機進行選擇無固定端口號。上述種種問題使得基于端口的分類方法的準確率較低。
基于深度包檢測(DPI,Deep Packet Inspection)的方法通過匹配各種網絡業務的應用層報文特征來進行對未知流量的識別。該方法可以有效克服動態端口、端口偽造等問題帶來的干擾,具有較高的識別準確率,但仍存在以下幾種問題:特征匹配算法復雜度高,面對龐大的數據量往往無法收斂;該方法只能分析明文傳輸的數據流量,對于現在很多應用實施的加密流量則無法進行解析;該方法將分析用戶所傳輸的具體內容,可能會對用戶的隱私造成侵犯。
基于機器學習(Machine Learning)的方法基于網絡流量的統計特征進行對未知流量的識別。常見的流統計特征有:包大小、包到達時間間隔、網絡空閑和活躍時間等等。以上述統計特征表示的網絡流量作為機器學習模型的輸入,通過一定的訓練方法可以實現基于機器學習模型的網絡流量識別。常見的機器學習算法,如支持向量機(SVM,SupportVector Machines)、樸素貝葉斯(Bayes)和決策樹(DT,Decision Tree)等已經被用于網絡流量識別工作中。但是,基于流統計特征的機器學習識別方法需要大量帶有標簽的經驗數據來訓練構造分類器,獲取大量帶標簽的數據需要耗費大量人力物力,且標簽的準確性尚有待考證。
發明內容
本發明的目的是提供一種半監督網絡流量分類方法,具有較高的分類識別準確度。
本發明的目的是通過以下技術方案實現的:
一種半監督網絡流量分類方法,包括:
預先使用一定數量的網絡流量數據無監督的訓練特征提取模塊,以及使用若干有標簽網絡流量數據和一定數量的無標簽網絡流量數據無監督的訓練半監督流量分類模塊;
利用訓練好的特征提取模塊從原始網絡流量數據中提取隱含表達特征,再利用訓練好的半監督流量分類模塊,基于提取到的隱含表達特征對相應原始網絡流量數據進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910161343.9/2.html,轉載請聲明來源鉆瓜專利網。





