[發明專利]一種基于SOM與K-means融合算法的網絡流量分類方法有效
| 申請號: | 201911194495.5 | 申請日: | 2019-11-28 |
| 公開(公告)號: | CN111211994B | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 趙莎莎;肖毅;張登銀;寧越強;王飛;李速 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | H04L47/2441 | 分類號: | H04L47/2441;H04L43/0876;G06N3/08;G06K9/62 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 som means 融合 算法 網絡流量 分類 方法 | ||
本發明公開了一種基于SOM與K?means融合算法的網絡流量分類方法,首先采用SOM算法對流量數據進行一次聚類,求出聚類結果中各個簇的簇中心及簇的數目,將簇中心作為K?means的初始聚類中心,再將簇的數目作為K值,執行K?means算法進行二次聚類得到輸出結果。采用S_Dbw指數作為聚類結果評價指標,對于包含各種噪聲和不同密度的數據集,該指數具有較強的魯棒性。本發明與基于監督學習的流量分類算法相比,減少了標注類別的成本,與其他基于無監督學習的的算法相比性能更優。
技術領域
本發明涉及網絡流量分析及網絡安全等領域,具體涉及一種基于SOM與K-means融合算法的網絡流量分類方法。
背景技術
隨著互聯網的迅猛發展,大數據時代的到來,越來越多的新型網絡應用逐漸興起,網絡規模不斷擴大,網絡組成愈發復雜,對于網絡的管理和分析需求增加。網絡流量分類技術作為網絡可控性的基礎技術之一,可以幫助網絡運營商提供更好的服務質量,對網絡進行有效地監管。對網絡流量進行分析,可以識別并過濾掉網絡病毒,檢測出垃圾郵件和非法入侵,提高了網絡的安全性能。因此網絡流量分類技術對于提高網絡的管理效率,保障網絡環境的綠色和安全有著至關重要的作用。
常用的流量分類技術主要有以下三類:①基于端口號的流量分類方法:端口號與所需應用程序之間的對應關系由IANA(互聯網數字分配機構)定義,這種方法存在著嚴重的局限性,例如服務器端口可以動態分配,具有不同QoS級別服務可以使用相同的端口號等,這些原因導致基于端口號的流量分類方法不再適用當前網絡;②基于有效載荷的流量分類方法:這種方法需要精確了解應用層數據以及其數據包的格式,只能用于非加密流量,而當前網絡的應用程序有效負載的加密性好,這種方法的局限性較大;③基于流量統計特征的分類方法:通過流量的特征來建立機器學習的模型,然后再用數據集訓練并完善模型,通過模型來預測未知流量的種類,由于其適用范圍廣泛,該方法被廣泛地研究和使用。
目前針對流量分類的機器學習模型主要是基于監督學習算法,如基于K近鄰、支持向量機、NaiveBayes,而基于無監督學習的機器學習模型研究較少,無監督學習的優點在于不需要將訓練數據貼上標簽,從而大大減少了人工標注類別的成本,因此本發明提出基于以無監督學習中的K-means算法為核心的流量分類方法。
發明內容
發明目的:為了克服現有技術中存在的不足,本發明提供一種基于SOM與K-means融合算法的網絡流量分類方法,與其他方法不同之處,本發明以無監督學習的K-means算法為核心將SOM算法與其結合從而進行優化。
技術方案:為實現上述目的,本發明采用的技術方案為:
一種基于SOM與K-means融合算法的網絡流量分類方法,包括以下步驟:
步驟1,采集網絡流量數據集,確定訓練集,并統計流量特征;
步驟2,采用基于相關性的特征選擇算法對統計后的流量特征進行篩選,然后從篩選后的訓練集中計算特征-類相關矩陣和特征-特征相關矩陣,其次用最佳優先搜索方法搜索特征子集空間,計算特征子集的估計值,找出估計值最大的特征子集,作為最優特征子集;
步驟3,融合算法將聚類分為兩階段進行,第一階段:將最優特征子集對應的特征向量作為輸入樣本輸入SOM網絡,執行SOM算法不斷更新各個神經元的權值,直至達到設定的迭代次數,結束算法運行,輸出聚類結果,計算出聚類后的簇中心和簇的數目;第二階段:將第一階段聚類后的簇中心和簇的數目分別作為K-means算法的初始聚類中心和初始K值,執行K-means算法直至算法收斂,輸出最終的聚類結果;
步驟4,使用S_Dbw指數評估算法的聚類效果。
優選的:步驟2中所述的基于相關性的特征選擇算法包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911194495.5/2.html,轉載請聲明來源鉆瓜專利網。





