[發明專利]面向推理的應用流量和指標向量化方法及系統有效
| 申請號: | 202110352102.X | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN113098735B | 公開(公告)日: | 2022-10-11 |
| 發明(設計)人: | 支鳳麟;蔡曉華 | 申請(專利權)人: | 上海天旦網絡科技發展有限公司 |
| 主分類號: | H04L43/04 | 分類號: | H04L43/04;G06N5/04 |
| 代理公司: | 上海段和段律師事務所 31334 | 代理人: | 李佳俊;郭國中 |
| 地址: | 200086 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 推理 應用 流量 指標 量化 方法 系統 | ||
1.一種面向推理的應用流量和指標向量化方法,其特征在于,包括:
步驟S1:將分布式系統內已知網絡流量以及當前流量的相關設備的原始指標信息量化為同樣類型的元組,得到已知網絡流量信息元組和指標信息元組;
步驟S2:將分布式系統內未知網絡流量量化為同樣類型的元組,得到未知網絡流量信息元組;
步驟S3:基于已知網絡流量信息元組、指標信息元組以及未知網絡流量信息元組按照時間窗口和先驗關聯關系構成網絡,使用隨機游走的方法采樣網絡描述信息;
步驟S4:基于網絡描述信息利用嵌入算法得到網絡流量向量和指標信息向量;
步驟S5:根據網絡流量向量、指標信息向量進行根因分析以及指標預測;
所述元組包括編碼和時間,編碼為正整數id值;時間為流量起始時間點或指標采樣時間點;
所述步驟S3包括:
步驟S3.1:使用步長S,窗口長度T的滑動窗口將連續的已知流量元組、未知流量元組以及指標元組劃分為集合,其中,ST,前后窗口之間有重疊,并將每個元組記為F;
步驟S3.2:將時間窗口T的集合內所有元組F按照集合內的時間排序,構成元組F的鏈表;讀入元數據關聯信息,將有關聯的F結點之間進行直接連接,構成已知流量、未知流量、指標元素關聯圖;
步驟S3.3:在已知流量、未知流量、指標元素關聯圖上任意選擇一個起點F,進行隨機游走,游走N個節點生成一個游走序列[F1,F2,…FN];
步驟S3.4:選擇一個未曾被選擇起點的F,重新游走并生成游走序列,重復執行步驟S3.4,直至預設數量以上的節點均被訪問,輸出游走序列;
所述步驟S5包括:
步驟S5.1:接受需要根因分析的流量和/或指標的正整數id和時間t,當分析目標為流量和指標時,則t為流量和指標中的最晚時間;
步驟S5.2:以t為起點,S為步長,T為窗口大小,沿時間軸反向將歷史流量/指標進行劃分;
步驟S5.3:將劃分后窗口中的所有流量和/或指標正整數id對應的向量經行累加后求均值,作為當前時間窗口的特征,記為Venv;
步驟S5.4:獲取需要根因分析的流量和/或指標id對應的向量,當分析目標為流量和指標時,則向量為流量和指標向量的均值,作為待分析目標的特征,記為Vtar;
步驟S5.5:根據當前時間窗口的特征Venv和待分析目標的特征Vtar,基于包括特征加權和或特征均值計算待分析目標在當前時間窗口下的特征Vcom;
步驟S5.6:計算上一時間窗口中所有的流量和/或指標對應的向量與Vcom的相似度,取相似度大于預設值的M個流量和/或指標作為上一時間窗口中的可能根因;重復執行步驟S5.3至步驟S5.6,直至相似度大于預設值的流量和/或指標不存在;
所述步驟S5還包括:計算當前時間窗口所有流量和/或指標向量與當前時間窗口的特征Venv之間的相似性,最相似的M個向量對應的流量/指標為可能預測值。
2.根據權利要求1所述的面向推理的應用流量和指標向量化方法,其特征在于,所述步驟S1包括:
步驟S1.1:獲取原始流量信息,為原始流量信息中每種已知流量類型分配唯一正整數id;
步驟S1.2:獲取涉及到當前流量的相關設備的原始指標信息,為原始指標信息中每種指標信息分配唯一正整數id,當指標為連續值時,則離散化后為每一類離散值分配唯一正整數id,得到指標信息元組;
步驟S1.3:根據已知流量規則,從原始流量中提取已知流量,并記錄為已知流量信息元組;
所述流量規則包括端口、協議名稱以及數據包格式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海天旦網絡科技發展有限公司,未經上海天旦網絡科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110352102.X/1.html,轉載請聲明來源鉆瓜專利網。





