[發明專利]一種基于譜聚類的未知協議聚類分析方法、裝置及介質有效
| 申請號: | 202111394489.1 | 申請日: | 2021-11-23 |
| 公開(公告)號: | CN114118255B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 倪綠林;張文政;吉慶兵;談程;羅杰;陳曼;康璐 | 申請(專利權)人: | 中國電子科技集團公司第三十研究所 |
| 主分類號: | G06F18/23213 | 分類號: | G06F18/23213;G06F18/2411;G06F18/214 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 張杰 |
| 地址: | 610000 *** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 譜聚類 未知 協議 聚類分析 方法 裝置 介質 | ||
1.一種基于譜聚類的未知協議聚類分析方法,其特征在于,網絡流量樣本集通過篩選去除缺失上行第一包的的樣本后,假設由n個樣本A1,A2,...,An組成樣本集Ω,選取樣本Ai的上行第一包載荷數據a1a2…作為該樣本的協議代表序列,即其中li為該樣本的長度且單位為字節,i∈{1,2,...,n},則所述基于譜聚類的未知協議聚類分析方法包括以下步驟:
Step1:根據序列長度閾值l*,按照如下公式對樣本的協議代表序列進行處理:
式中Ai[:l*]表示A的前l*個字符組成的序列;
Step2:使用兩個字節序列之間最長公共子序列的長度來度量樣本之間的相似性,計算的相似性矩陣S∈Rn×n,構建相似性連接圖;
Step3:構建鄰接矩陣W和度矩陣D;
Step4:計算拉普拉斯矩陣L=D-W;
Step5:求取拉普拉斯矩陣L的k個最小特征值所對應的特征向量ν1,ν2,…,vk,其中k為聚類的數量,νi∈Rn×1;
Step6:構造矩陣V=[ν1,ν2,...,νk]∈Rn×k;
Step7:將矩陣V的行向量作為樣本,使用k-means聚類算法將這n個樣本聚類成k類;
Step8:輸出聚類后的結果C=(C1,C2,...,Ck)。
2.根據權利要求1所述的一種基于譜聚類的未知協議聚類分析方法,其特征在于,Step2中,計算的相似性矩陣S∈Rn×n的方法如下:
式中表示和的最長公共子序列長度。
3.根據權利要求2所述的一種基于譜聚類的未知協議聚類分析方法,其特征在于,假設存在兩個序列A=a1a2a3...an和B=b1b2b3...bm,使用L(A,B)表示A和B的最長公共子序列長度,則L(A,B)具有如下推導公式:
其中A[:i]代表A的前i個字符組成的序列。
4.根據權利要求1所述的一種基于譜聚類的未知協議聚類分析方法,其特征在于,Step3中,構建鄰接矩陣W的方法如下:
式中σ表示樣本點的鄰域寬度,σ越大則W越大,即樣本點之間的相似度越大。
5.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時,實現權利要求1-4任一項所述的一種基于譜聚類的未知協議聚類分析方法的步驟。
6.一種計算機可讀存儲介質,存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時,實現權利要求1-4任一項所述的一種基于譜聚類的未知協議聚類分析方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技集團公司第三十研究所,未經中國電子科技集團公司第三十研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111394489.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種測量溶液中EZ寬度的方法
- 下一篇:一種帶放大鏡的鏡柜





