[發明專利]根因定位方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202010170390.2 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111459695A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 陳楨博;徐亮;金戈 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06F17/18;G06K9/62 |
| 代理公司: | 北京鴻元知識產權代理有限公司 11327 | 代理人: | 董永輝;張超艷 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 定位 方法 裝置 計算機 設備 存儲 介質 | ||
本發明涉及一種根因定位方法、裝置、計算機設備和存儲介質,用于定位運維系統工作中故障的根因,在接收到異常信息并發出告警信息后,根據調用鏈查找所有與告警信息相關聯的告警指標;對所有告警指標的數值進行平滑處理,并分別進行相似度計算以獲取lag值較高的告警指標的相似度值;匯總所述lag值較高的告警指標的相似度值,結合調用鏈層級關系,對相似度值較高的告警指標進行排序后將排序靠前的告警指標對應的調用鏈設備作為根因輸出。本發明根因的確定基于告警指標相似度、異常信息、告警時刻和調用關系等多種維度,保證了根因識別的完整性與準確性,能夠挖掘到更加復雜的根因關系,運維人員能夠根據告警指標快速排查,并進行故障修復工作。
技術領域
本發明涉及設備測試技術領域,特別是涉及一種根因定位方法、裝置、計算機設備和存儲介質。
背景技術
對于計算機信息系統的運行維護工作,設備故障的快速修復是首要目標。這一工作共分為兩個主要部分,即異常檢測與根因識別。異常檢測是指根據設備的各個監控指標,對于指標采集異變發出告警,從而提示工作人員及時關注并處理。根因識別則是根據告警,為工作人員推薦根因故障或設備,省去人工進行逐一排查的耗時。異常檢測與根因識別的準確性,能夠有效幫助運維工作及時發現故障并快速修復。
傳統的根因分析系統,僅僅基于運維設備的層級調用鏈與異常檢測告警。這一方法屬于靜態規則,當設備層級發生多個告警后,系統會優先認定調用鏈下游的指標為根因。靜態規則方法較為固定,當根因指標未產生告警,或者根因不符合調用鏈邏輯時,根因識別結果存在錯誤,無法真實反映設備故障的原因。
因此,現有技術還有待改進。
發明內容
基于此,有必要針對傳統根因分析系統僅僅進行靜態分析法則的缺陷,提供一種動態的根因定位方法、裝置、計算機設備和存儲介質。
一種根因定位方法,所述根因定位方法用于根因分析系統定位運維工作中故障的根因,包括如下步驟:
接收到異常信息并發出告警信息;
根據調用鏈查找所有與告警信息相關聯的告警指標,并收集所述告警指標的數值;
對所有所述告警指標的數值進行平滑處理,并將所有告警指標結合預設的lag值分別進行相似度計算,以獲取lag值較高的告警指標的相似度值;
匯總所述lag值較高的告警指標的相似度值,結合所述調用鏈層級關系,對相似度值較高的告警指標進行排序;
將所述相似度值排序靠前的告警指標作為根因告警指標輸出。
在其中一個實施例中,所述收集與告警指標的數值是收集告警前1~2小時到告警后10分鐘之間的告警指標的數值。
在其中一個實施例中,所述對所有所述告警指標的數值進行平滑處理,并將所有告警指標結合預設的lag值分別進行相似度計算,以獲取lag值較高的告警指標的相似度值具體包括如下步驟:
通過LOESS算法進行局部加權回歸得到回歸值獲取序列平滑值;
預設lag值為0~90分鐘;
將所有告警指標在預設各lag值下與入口指標分別計算相似度,得到所有告警指標在各lag值下的lag值告警指標;
將相似度值大于0.65的lag值告警指標進行相似度值歸并,以獲取相似度值較高的告警指標。
在其中一個實施例中,所述對告警指標相似度值的計算還包括如下步驟:
采集告警指標通過LOESS算法獲取的所述序列平滑值與歷史STL周期分量的殘差值;
對于存在STL周期分量殘差值的告警指標分別進行相似度計算,以得到STL殘差值告警指標的相似度值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010170390.2/2.html,轉載請聲明來源鉆瓜專利網。





