[發明專利]基于t分布混合模型的網絡多媒體業務半監督分類方法有效
| 申請號: | 201710077295.6 | 申請日: | 2017-02-14 |
| 公開(公告)號: | CN106878073B | 公開(公告)日: | 2019-10-08 |
| 發明(設計)人: | 董育寧;趙家杰 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/26;G06K9/62 |
| 代理公司: | 南京知識律師事務所 32207 | 代理人: | 李湘群 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分布 混合 模型 網絡 多媒體 業務 監督 分類 方法 | ||
本發明公開了基于t分布混合模型的網絡多媒體業務半監督分類方法,具體包含數據集預處理、t分布聚類過程和分類過程。數據集預處理采集互聯網上各種多媒體業務的數據流樣本,然后進行預處理操作。t分布聚類過程對上述網絡數據流樣本執行t分布混合模型或有限t分布混合模型的擬合工作,得到K個多維t分布聚類。分類過程對上述聚類后的結果進一步進行分類,并計算最后分類的總體正確率。本發明使用t分布混合模型對多媒體業務進行更加精確的擬合,提高了分類的準確度。有限t分布混合模型的EM算法有效地提高了t分布混合模型的收斂速度。實驗表明提出的算法有較高的準確率,并且擬合的模型要優于傳統的K?means算法和傳統的高斯混合模型的EM算法。
技術領域
本發明屬于網絡流量分類方法,具體涉及一種基于t分布混合模型的網絡多媒體業務半監督分類方法。
背景技術
近年來,由于網絡多媒體業務的不斷發展,網絡流量的監測管理和網絡安全的難度也隨之提升。對當前網絡進行流量分類和分析能夠幫助互聯網服務提供商和相關網絡管理人員了解當前網絡狀況,以保障網絡的服務質量(QoS,Quality of Service)、提高計算機網絡的性能。因此,網絡流量分類成為當前計算機網絡的研究熱點。
流量分類主要可以分為四種:基于端口號的方式、深度包檢測、基于統計的方式和基于行為和機器學習的方式。由于新的網絡應用層出不窮,加密傳輸、動態端口號等技術的出現使得前兩種方法對流量分類的準確率大為降低。而單獨采用統計的方式只能從宏觀角度對流量進行分析,不能規避一些無關的統計特征,導致計算量大。目前通常采用機器學習的方式進行流量分類。
關于流量識別的機器學習算法,主要分為有監督分類算法、無監督分類算法和半監督分類算法。半監督分類是有監督分類和無監督分類的結合。由于其結合了已知標簽的樣本,可以提前獲取部分信息,所以被一些算法所采用。部分半監督網絡流量分類的算法采用K-means及其改進算法進行分類;部分算法采用EM(Expectation Maximization)算法并使用高斯混合模型(GMM,Gaussian Mixture Model)進行擬合。但是受到數據樣本的離群點的影響,這些算法的準確率都偏低。
發明內容
為克服以上算法的缺點,本發明使用t分布混合模型(TMM,t-distributionMixture Model)的EM算法對網絡流量的數據樣本進行擬合,并提出一種有限t分布混合模型(LTMM,Limited t-distribution Mixture Model),提高了TMM擬合時的收斂速度。實驗結果表明,本發明對于多媒體網絡業務的流量分類,總體正確率可達到97%以上,要優于傳統的K-means算法和傳統的高斯混合模型的EM算法。
為達到上述目的,本發明的技術方案為基于t分布混合模型的網絡多媒體業務半監督分類方法,具體包含以下步驟:
(1)數據集預處理:采集互聯網上各種多媒體業務的數據流樣本,然后進行預處理操作;
(2)t分布聚類過程:對上述網絡數據流樣本執行t分布混合模型或有限t分布混合模型的擬合工作,得到K個多維t分布聚類;
(3)分類過程:對上述聚類后的結果進一步進行分類,并計算最后分類的總體正確率。
進一步,上述預處理操作具體包括:
(2.1)對數據流樣本進行z-score標準化操作,使數據無量綱化;
(2.2)特征提取,又包括以下步驟:
(2.2.1)根據數據流樣本,分別采用信息增益、信息增益率、一致性特征選擇方式進行特征選擇,提取出相應的特征組合;
(2.2.2)對這些特征組合分別進行后續的實驗分析,確定算法對應的較好的特征選擇方法,提取出有效的特征組合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710077295.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種報文傳輸方法和裝置
- 下一篇:流量過濾方法及裝置





