[發明專利]一種網絡流量分析方法、裝置、存儲介質及設備有效
| 申請號: | 201910949502.1 | 申請日: | 2019-10-08 |
| 公開(公告)號: | CN110650058B | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 丁琦;梁松濤;李鑫;衛志剛;李頂占;李旭升;陳允;劉金輝;楊振贏;張珂飛 | 申請(專利權)人: | 河南省云安大數據安全防護產業技術研究院有限公司 |
| 主分類號: | H04L41/14 | 分類號: | H04L41/14;H04L43/08 |
| 代理公司: | 鄭州德勤知識產權代理有限公司 41128 | 代理人: | 黃紅梅 |
| 地址: | 450000 河南省鄭州市金水區楊金*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡流量 分析 方法 裝置 存儲 介質 設備 | ||
1.一種網絡流量分析方法,其特征在于,包括以下步驟:
S1、獲取不同時間段和/或不同空間和/或不同地址和/或不同業務的多個流量時間序列數據;
S2、基于所述多個流量時間序列數據之間的距離的計算,對所述多個流量時間序列數據進行聚類;
S3、根據對所述多個流量時間序列數據聚類的結果,從時間序列待選特征集中篩選出一項或多項特征,組成分析特征集;其中篩選特征的原則是,通過衡量特征值或特征向量在聚類得到的各個類別中的分布的重疊程度,選擇所述重疊程度較低的特征;
步驟S3具體為:
針對所述時間序列待選特征集中的每項特征Fk,計算所述多個流量時間序列數據的特征值或者特征向量,其中k=1,…,M;M是所述時間序列待選特征集中特征的項數;
根據對所述多個流量時間序列數據聚類的結果,假設聚類得到N個類別,對于所述每項特征Fk:
如果Fk的取值為離散型,則分別計算在聚類得到的每個類別中,Fk的概率函數Pki(x)(x=x1,x2,x3,……),i=1,…,N;對于Pk1(x),…,PkN(x),求其兩兩之間的差的絕對值并相對于x的所有取值求和,再將所有和值相加,得到,其中x=x1,x2,x3,……;
如果Fk的取值為連續型,則分別計算在聚類得到的每個類別中,Fk的概率密度函數fki(x);對于fk1(x),…,fkN(x),求其兩兩之間的差的絕對值的積分,再將所有積分值相加,得到;
然后取Gk值最大的一項或多項特征,組成分析特征集;
S4、根據所述分析特征集,對流量時間序列數據提取特征并進行網絡流量的分類和/或預測和/或異常檢測。
2.根據權利要求1所述的網絡流量分析方法,其特征在于,所述的對所述多個流量時間序列數據進行聚類,包括:使用劃分聚類方法或者層次聚類方法,對所述多個流量時間序列數據進行聚類。
3.根據權利要求1所述的網絡流量分析方法,其特征在于,所述的對流量時間序列數據提取特征并進行網絡流量的分類和/或預測和/或異常檢測,包括:對流量時間序列數據提取特征,然后使用統計分析或者機器學習的方法,進行網絡流量的分類和/或預測和/或異常檢測。
4.根據權利要求1所述的網絡流量分析方法,其特征在于,所述時間序列待選特征集中的特征,包括時域統計特征、變換域統計特征、模型特征、分形特征中的一類或者多類特征。
5.根據權利要求1所述的網絡流量分析方法,其特征在于,所述距離包括歐幾里得距離、閔科夫斯基距離、曼哈頓距離、切比雪夫距離、夾角余弦相似度、皮爾遜相關系數、馬氏距離、漢明距離、弗雷歇距離、杰卡德相似度、相關距離、冪距離中的一種或者多種。
6.根據權利要求2所述的網絡流量分析方法,其特征在于,所述劃分聚類方法包括K均值聚類算法、K中心點聚類算法、K中值聚類算法、K眾數聚類算法中的一種或者多種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南省云安大數據安全防護產業技術研究院有限公司,未經河南省云安大數據安全防護產業技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910949502.1/1.html,轉載請聲明來源鉆瓜專利網。





