[發明專利]一種具有智能故障分析處理功能的運維管理系統在審
| 申請號: | 201711053307.8 | 申請日: | 2017-10-31 |
| 公開(公告)號: | CN107612756A | 公開(公告)日: | 2018-01-19 |
| 發明(設計)人: | 姚小艷 | 申請(專利權)人: | 廣西宜州市聯森網絡科技有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24 |
| 代理公司: | 北京天奇智新知識產權代理有限公司11340 | 代理人: | 林鵬 |
| 地址: | 546399 廣西壯族自治區河*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 具有 智能 故障 分析 處理 功能 管理 系統 | ||
技術領域
本發明涉及系統運維管理技術領域,尤其是一種具有智能故障分析處理功能的運維管理系統。
背景技術
目前IT運維系統規模不斷增長,系統在對服務器、虛擬機、交換機等網絡設備性能及其網絡連通性進行監測過程中,運維人員每天會收到越來越多的監控報警,面對海量的運維指標當系統出現故障時,運維人員很難從海量監控指標中迅速找到故障根因,報警風暴極大地降低了定位問題的速度,故障恢復速度基本依賴于運維人員的經驗以及操作響應速度。因此建立一個故障自動診斷與快速恢復系統協同處理的智能運維平臺,針對多場景構建機器學習模型與大數據專家系統,實時對運維平臺的異常進行在線診斷與定位,當系統出現故障時通過執行相應策略實現快速修復,恢復正常運行是人們所需要的。
發明內容
為了克服上述問題,本發明提供一種具有智能故障分析處理功能的運維管理系統,實時對系統的異常進行在線診斷與定位,當系統出現故障時通過執行相應策略實現快速修復,并且能自動對修復結果不理想及修復時間過長的故障提醒系統管理員進行優化。
本發明解決其技術問題所采用的技術方案是:
一種具有智能故障分析處理功能的運維管理系統,包括系統監測模塊、故障信息識別模塊、故障修復模塊、故障修復評估模塊,故障實例數據庫、腳本調用模塊和算法調用模塊;
所述系統監測模塊用于監測系統的運行狀態,當監測到異常時,系統監測模塊將當前的狀態參數及監測到的異常情況傳遞給故障信息收集模塊;所述系統監測模塊還用于采集原始日志數據并將其進行初步整理、格式化
所述故障信息識別模塊用于將收集模塊傳遞收集到的異常情況進行識別確認是否為虛警,將判斷為故障的信息傳遞給故障修復模塊進行修復;
所述故障修復模塊用于在接收到故障信息識別模塊的報警信息后根據故障特征對故障進行修復;
所述故障修復評估模塊用于對故障修復模塊的故障修復結果進行評估是否合格;所述故障修復評估模塊還包括時間檢測單元,所述時間檢測單元用于檢測故障修復花費時間并判斷所花費的時間是否大于閾值;
所述故障實例數據庫用于存儲系統的歷史故障實例與故障特征;
所述腳本調用模塊用于存放及執行各類故障的維護腳本;
所述算法調用模塊用于存儲并執行各類分類算法、識別算法、匹配算法,供各模塊進行調用計算。
進一步的,所述故障修復評估模塊還用于對故障修復后,根據系統的運行狀態對每次修復結果進行打分,定期將打分低的自修復執行過程提交給系統管理員進行分析,并提示管理員優化存諸在腳本調用模塊中對應的腳本。
進一步的,所述時間檢測單元工作流程為:當故障修復模塊在接收到故障信息識別模塊的報警信息后,所述時間檢測單元檢測并記錄當前系統時間,當故障修復模塊將故障修復后,所述時間時間檢測單元再次檢測并記錄當前系統時間,并計算兩次所檢測到的時間間隔,并判斷所述時間間隔是否大于閾值,當所述時間間隔大于閾值時,將該故障自修復執行過程提交給系統管理員進行分析,并提示管理員優化存諸在腳本調用模塊中對應的腳本。
進一步的,所述閾值為修復該故障所需平均時間的2-3倍。
進一步的,所述報警信息識別模塊接收到報警信息后,提取報警信息的特征與故障實例數據庫的故障特征進行初步匹配并計算評分,當評分高于預設閾值時,則認為此為故障信息;當評分低于預設閾值時,提取腳本調用模塊中的功能驗證腳本執行,對業務進行持續一段時間的驗證與觀察如持續一段時間內,如業務與功能都正常,則認為此報警為虛警,同時,系統將此種情況存及其特征數據提交至故障實例數據庫。
進一步的,所述故障修復模塊對故障修復過程為:在接收到報警信息后,將接收到的故障信息與故障實例數據庫的各類故障特證進行一一比對,選取若干個相似度最高的故障信息,從故障實例數據庫中拉取對應的主動診斷腳本的編號,再到腳本調用模塊中調用主動診斷腳本,來進一步獲取診斷日志,獲取到診斷日志后,與故障實例數據庫的中的實例特證進行一一比對,計算契合度;當有多個契合度達標,則首先采用契合度高的方案調用執行對應的修復腳本,進行修復,修復完成后,再調用故障修復評估模塊進行評估,評估達標則修復完成;如果評估不達標,則進行回退,再執行下一個契合度達標的方案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西宜州市聯森網絡科技有限公司,未經廣西宜州市聯森網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711053307.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種云資源的管理方法及其裝置
- 下一篇:紡織面料(2017?58)





