[發(fā)明專利]一種虛擬機異常檢測方法、裝置、設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201710627200.3 | 申請日: | 2017-07-28 |
| 公開(公告)號: | CN109308225A | 公開(公告)日: | 2019-02-05 |
| 發(fā)明(設計)人: | 陳力 | 申請(專利權)人: | 上海中興軟件有限責任公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06F9/455;G06K9/62 |
| 代理公司: | 北京元本知識產(chǎn)權代理事務所 11308 | 代理人: | 秦力軍 |
| 地址: | 201203 上海自由*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 虛擬機 殘差數(shù)據(jù) 異常檢測 存儲介質(zhì) 非高斯 通訊技術領域 獨立元分析 檢測結果 異常行為 時間點 | ||
本發(fā)明公開了一種虛擬機異常檢測方法、裝置、設備及存儲介質(zhì),涉及信息及通訊技術領域,所述方法包括:獲取虛擬機的非高斯性的殘差數(shù)據(jù);對所述非高斯性的殘差數(shù)據(jù)進行獨立元分析,確定所述虛擬機發(fā)生異常行為的時間點。本發(fā)明實施例采用基于殘差數(shù)據(jù)的獨立元異常檢測,得到的檢測結果更加準確、有效。
技術領域
本發(fā)明涉及信息及通訊技術(Information and Communication Technologies,ICT)的計算機性能指標監(jiān)控及異常檢測領域,特別涉及一種虛擬機異常檢測方法、裝置、設備及存儲介質(zhì)。
背景技術
云計算通過虛擬化等技術將現(xiàn)有的硬件資源進行整合,形成共享的資源池,使業(yè)務系統(tǒng)能夠按需獲取計算、存儲以及網(wǎng)絡資源,有效地解決了傳統(tǒng)IT基礎架構存在的問題。虛擬機是云平臺的核心部件,負責為業(yè)務系統(tǒng)提供計算和存儲資源,從而保證業(yè)務系統(tǒng)的正常運行。然而,隨著業(yè)務系統(tǒng)種類和數(shù)量的不斷增多,云平臺的規(guī)模不斷擴大,云平臺變得日益復雜,使得虛擬機在運行過程中很容易出現(xiàn)異常。虛擬機異常的存在不僅會導致業(yè)務系統(tǒng)無法正常運行,造成各種難以估量的損失;而且會引發(fā)企業(yè)對云計算的擔憂,阻礙云計算的發(fā)展和應用。因此,需要引入虛擬機異常檢測技術,及時發(fā)現(xiàn)虛擬機的異常行為,以提醒管理員采取必要措施,來保證虛擬機的正常運行。
由于虛擬機往往包含多個系統(tǒng)資源監(jiān)控指標,因此可采用近年來業(yè)界廣泛研究的多變量統(tǒng)計分析來應用于過程監(jiān)控和故障診斷。傳統(tǒng)的多變量統(tǒng)計監(jiān)控方法多采用主元分析(Principle Component Analysis,PCA),它將數(shù)據(jù)空間分解為主元子空間和殘差子空間,每一組測量數(shù)據(jù)都可以投影到這兩個子空間內(nèi),同時在兩個空間中分別引入HotellingT2(衡量包含在主元模型中的信息量的大小)和平方預測誤差SPE(Squared PredictionError,衡量不能被主元模型所描述的信息量的大小)這兩個統(tǒng)計量來監(jiān)測故障的發(fā)生。一般認為T2體現(xiàn)的是系統(tǒng)性變化,SPE體現(xiàn)的是非系統(tǒng)性變化,也就是說,基于殘差空間的SPE更能反映異常特征。PCA的問題在于,它是基于信號二階統(tǒng)計特性的分析方法,一般需要假設過程變量服從高斯分布。采用PCA算法的異常告警檢測系統(tǒng)如圖1所示,PCA算法服務接收時間序列源數(shù)據(jù)(即時間序列數(shù)據(jù)),經(jīng)過處理后輸出檢測的異常時間點,同時作為告警服務的輸入,從而產(chǎn)生異常告警。
另一種使用較多的方法是獨立元分析方法(Independent Component Analysis,ICA),與PCA不同,它是一種基于信號高階統(tǒng)計特性的分析方法,其目的是將觀察得到的數(shù)據(jù)進行某種線性分解,利用源信號的獨立性和非高斯性,使其分解成統(tǒng)計獨立的成分。將ICA應用于異常檢測時,與PCA一樣,對應引入I2(衡量包含在獨立元模型中的信息量的大小)和平方預測誤差SPE(Squared Prediction Error,衡量不能被獨立元模型所描述的信息量的大小)這兩個統(tǒng)計量來監(jiān)測故障的發(fā)生。ICA的問題在于,它的假設前提是獨立成分需要具有非高斯分布,否則將無法確定混合矩陣。采用ICA算法的異常告警檢測系統(tǒng)如圖2所示,ICA算法服務接收時間序列源數(shù)據(jù),經(jīng)過處理后輸出檢測的異常時間點,同時作為告警服務的輸入,從而產(chǎn)生異常告警。
由于虛擬機上承載的業(yè)務類型和應用行為多種多樣,實際系統(tǒng)觀測到的數(shù)據(jù)分布往往并不理想,兼具有高斯和非高斯分布的特點,因此僅采用傳統(tǒng)的PCA或ICA方法,就可能會造成故障的誤報和漏報。從已公開的一些專利和文獻來看,有學者嘗試將ICA算法用于高斯和非高斯信號的劃分,但實際并沒有克服ICA算法的假設前提,且對于高斯和非高斯信號的劃分缺乏比較好的指導原則;還有學者考慮時間序列的相關性,將數(shù)據(jù)按滑窗劃分為一個個局部片段數(shù)據(jù),這樣雖然窗口內(nèi)的數(shù)據(jù)可能不會形成復雜的分布,但由于樣本個數(shù)會大大減少,實際并不適合實施PCA、ICA等統(tǒng)計學算法。
發(fā)明內(nèi)容
本發(fā)明實施例提供的一種虛擬機異常檢測方法、裝置、設備及存儲介質(zhì),解決現(xiàn)有技術無法準確檢測虛擬機發(fā)生異常行為的時間點的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海中興軟件有限責任公司,未經(jīng)上海中興軟件有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710627200.3/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





