[發明專利]一種基于特征強相關的網絡流量分類方法在審
| 申請號: | 201910198841.0 | 申請日: | 2019-03-15 |
| 公開(公告)號: | CN110009005A | 公開(公告)日: | 2019-07-12 |
| 發明(設計)人: | 張登銀;吳思遠;丁飛;趙莎莎;張恩軒;郭詩源 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡流量分類 強相關 互信息計算 冗余度 多維特征向量 啟發式搜索 迭代計算 分類結果 分類模型 分類目標 分類效率 特征提取 特征向量 特征選擇 訓練過程 學習器 構建 集合 取出 分類 響應 保證 | ||
1.一種基于特征強相關的網絡流量分類方法,其特征在于:所述方法具體過程為:
步驟一:利用特征與響應變量之間的互信息獲得預先提取的特征之間的相關性;
步驟二:確定特征之間的相關性,根據特征之間的相關性確定特征之間的冗余度,并根據特征之間的冗余度獲得每個特征的得分并確定得分最高的特征;按照預先設定的次數m次迭代確定m個得分最高的特征作為最終的特征向量;
步驟三:根據分類目標構建分類模型并得到特征強相關網絡流量分類結果。
2.根據權利要求1所述的一種基于特征強相關的網絡流量分類方法,其特征在于:所述步驟二中利用特征與響應變量之間的互信息獲得特征之間的相關性,具體過程為:
假定X和Y表示兩個隨機變量,則特征與響應變量之間的互信息公式如下所示:
其中,ΩX和ΩY分別是隨機變量X和Y的樣本空間,p(x,y)是聯合概率密度函數,p(x)和p(y)是邊緣概率密度函數;
特征的相關性RS計算公式為:
其中,c∈C={+1,-1}表示類變量,S表示數據的特征向量集F的子集,fi為特征向量集F中的一個特征向量。
3.根據權利要求2所述的一種基于特征強相關的網絡流量分類方法,其特征在于:所述步驟三中根據特征之間的相關性確定特征之間的冗余度的公式為:
其中,fi,fj分別為子集S中的特征。
4.根據權利要求3所述的一種基于特征強相關的網絡流量分類方法,其特征在于:步驟二中根據特征之間的冗余度獲得每個特征的得分并確定得分最高的特征的公式如下:
按照預先設定的次數m次迭代確定m個得分最高的特征,表示如下:
5.根據權利要求1所述的一種基于特征強相關的網絡流量分類方法,其特征在于:根據分類目標構建分類模型是采用支持向量機SVM模型。
6.根據權利要求1所述的一種基于特征強相關的網絡流量分類方法,其特征在于:根據分類目標構建分類模型并得到特征強相關網絡流量分類結果具體包括以下步驟:
首先對分類目標進行分類,并針對不同的分類目標分別訓練分類模型;
將特征向量輸入不同的訓練模型得到最終的特征強相關網絡流量分類結果。
7.根據權利要求6所述的一種基于特征強相關的網絡流量分類方法,其特征在于:步驟三的具體方法包括以下步驟:
分類目標的類型分別為A、B、C和D,將分類目標的類型進行分類,分為A∪B、C∪D、A、B、C和D六類;
首先將特征向量分類模型SVM1中,所述分類模型SVM1用于分出A∪B和C∪D兩類;
將分類結果為A∪B類的特征向量通過分類模型SVM2,將分類結果為C∪D的特征向量通過分類模型SVM3中,所述分類模型SVM2用于分出A類和B類,所述分類模型SVM3用于分出C類和D類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910198841.0/1.html,轉載請聲明來源鉆瓜專利網。





