[發明專利]基于多元特征矩陣的XGB多維運維數據異常檢測方法在審
| 申請號: | 202010194474.X | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111461184A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 朱耀琴;韓仁松 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/20 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 朱炳斐;馬魯晉 |
| 地址: | 210094 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多元 特征 矩陣 xgb 多維 數據 異常 檢測 方法 | ||
1.一種基于多元特征矩陣的XGB多維運維數據異常檢測方法,其特征在于,所述方法包括以下步驟:
步驟1,根據產品服務數據,構建采集數據的METRIC表;
步驟2,根據METRIC表采集產品服務的運維數據,構造訓練樣本;
步驟3,根據訓練樣本構建數據集;
步驟4,利用數據集訓練XGB模型;
步驟5,利用訓練后的XGB模型對待檢測運維數據進行異常檢測。
2.根據權利要求1所述的基于多元特征矩陣的XGB多維運維數據異常檢測方法,其特征在于,步驟1中所述METRIC表的橫坐標表示所有產品服務數據名稱,縱坐標表示時間節點。
3.根據權利要求1或2所述的基于多元特征矩陣的XGB多維運維數據異常檢測方法,其特征在于,步驟2所述根據METRIC表采集產品服務的運維數據,構造訓練樣本,具體過程包括:
步驟2-1,設置采集運維數據的時間窗口長度標準,其用多元組表示為:
(WindowLength,TimeUnit,TimeInterval,TimePeriod,TimeLength)
式中,WindowLength表示時間窗口長度,TimeUnit表示運維數據采集時間單位,TimeInterval表示運維數據采集時間間隔,TimePeriod表示運維數據時間周期,TimeLength表示運維數據采集時間段長度;其中,
步驟2-2,根據時間窗口長度標準和METRIC表采集產品服務的運維數據,構造若干個訓練樣本;每一個訓練樣本對應一個包含運維數據的METRIC表;
步驟2-3,對每一個訓練樣本進行樣本打標,劃分正常樣本和異常樣本,分別作為負樣本和正樣本。
4.根據權利要求3所述的基于多元特征矩陣的XGB多維運維數據異常檢測方法,其特征在于,步驟3所述根據訓練樣本構建數據集,具體過程包括:
步驟3-1,按照時間節點先后順序對所有訓練樣本進行排列,形成訓練樣本序列;
步驟3-2,利用基于滑動窗口的數據集訓練方法從所述訓練樣本序列中提取訓練樣本,構造數據集。
5.根據權利要求4所述的基于多元特征矩陣的XGB多維運維數據異常檢測方法,其特征在于,步驟4所述利用數據集訓練XGB模型,具體過程包括:
步驟4-1,對數據集中的負樣本進行欠采樣處理;
步驟4-2,對數據集中每一個樣本的所有運維數據進行歸一化處理;
步驟4-3,針對每一個樣本中的每一類運維數據,提取其數據特征,包括統計特征、分類特征和序列特征;其中,序列特征為基于時間序列分析方法提取的特征;
步驟4-4,針對每一個樣本,構建其多元特征矩陣MF:
式中,為第i個維度運維數據的統計特征向量,為第i個維度運維數據的分類特征向量,為第i個維度運維數據的序列特征向量,i∈[1,n];
步驟4-5,對MF進行縱向處理,獲得新的多元特征矩陣MF':
式中,
步驟4-6,初始化XGB模型的訓練參數;
步驟4-7,分別為統計特征、分類特征和序列特征分配權重ω1、ω2、ω3,ω1+ω2+ω3=1,之后將所有樣本對應的多元特征矩陣輸入至XGB模型進行訓練,更新XGB模型的參數,直至達到預設訓練結束條件,輸出最終的XGB模型及其參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010194474.X/1.html,轉載請聲明來源鉆瓜專利網。





