[發明專利]一種基于機器學習的系統故障診斷智能化運維方法及系統在審
| 申請號: | 201910010700.1 | 申請日: | 2019-01-03 |
| 公開(公告)號: | CN109800127A | 公開(公告)日: | 2019-05-24 |
| 發明(設計)人: | 曾德強 | 申請(專利權)人: | 眾安信息技術服務有限公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F11/32;G06F11/34;G06K9/62 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 顧友 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 運維 指標數據 標注 系統故障診斷 故障診斷 基于機器 數據模型 智能化 機器學習模型 計算分析系統 抓取 診斷 故障產生 故障原因 獲取系統 機器學習 健康狀況 決策組件 使用場景 數據觸發 無人值守 異常堆棧 異常指標 診斷結果 自我修復 告警 圖譜 采集 監控 學習 環節 決策 應用 發現 | ||
1.一種基于機器學習的系統故障診斷智能化運維方法,其特征在于,所述方法包括如下步驟:
S1:獲取系統的指標數據和標注數據;
S2:根據所述指標數據以及標注數據分別訓練不同使用場景的數據模型;.
S3:根據采集到的當前指標數據以及所述數據模型,計算分析系統運行健康狀況以及對抓取到的異常指標數據觸發故障診斷和告警;
S4:根據機器學習建立的關系圖譜以及異常堆棧標注數據,診斷出故障原因。
2.根據權利要求1所述的基于機器學習的系統故障診斷智能化運維方法,其特征在于,所述獲取標注數據至少包括:
獲取所述指標數據中的異常指標數據,對所述異常指標數據進行指標異常波動標注以及指標異常波動原因標注;和/或,
獲取異常指標數據的異常堆棧信息,標注所述異常堆棧的關鍵詞;和/或,
對排查出的故障問題數據進行標注。
3.根據權利要求1或2所述的基于機器學習的系統故障診斷智能化運維方法,其特征在于,所述步驟S3具體包括:
根據時間窗口抓取到當前指標數據中的異常指標數據后,觸發故障診斷和告警;和/或,
利用所述數據模型計算分析所述當前指標數據,獲取系統運行健康狀況,并根據抓取到的異常指標數據觸發故障診斷和告警。
4.根據權利要求1或2所述的基于機器學習的系統故障診斷智能化運維方法,其特征在于,所述步驟S4具體包括:
根據機器學習建立的關系圖譜以及異常堆棧標注數據,分別進行自檢,獲取自檢結果;和/或
利用先前排查問題獲取的決策數據計算故障可能存在的所有原因,并進行相應的檢查,獲取檢查結果;
根據所述自檢結果和所述檢查結果分析出故障原因。
5.根據權利要求4所述的基于機器學習的系統故障診斷智能化運維方法,其特征在于,所述步驟S4還包括:
若是不能自動分析出所述故障原因,則人工介入處理,并對所述異常指標數據進行標注后保存至標注庫中。
6.一種基于機器學習的系統故障診斷智能化運維系統,其特征在于,所述系統包括:
數據收集模塊,用于獲取系統的指標數據和標注數據;
模型訓練模塊,用于根據所述指標數據以及標注數據分別訓練不同使用場景的數據模型;
計算分析模塊,用于根據采集到的當前指標數據以及所述數據模型,計算分析系統運行健康狀況以及對抓取到的異常指標數據觸發故障診斷和告警;
故障診斷模塊,用于根據機器學習建立的關系圖譜以及異常堆棧標注數據,診斷出故障原因;
告警模塊,用于根據所述異常指標數據發出相應的告警。
7.根據權利要求6所述的基于機器學習的系統故障診斷智能化運維系統,其特征在于,所述數據收集模塊包括:
標注單元,用于獲取所述指標數據中的異常指標數據,對所述異常指標數據進行指標異常波動標注以及指標異常波動原因標注;和/或,
獲取異常指標數據的異常堆棧信息,標注所述異常堆棧的關鍵詞;和/或,
對排查出的故障問題數據進行標注。
8.根據權利要求6或7所述的基于機器學習的系統故障診斷智能化運維系統,其特征在于,所述計算分析模塊包括:
規則分析單元,用于根據時間窗口抓取到當前指標數據中的異常指標數據后,觸發故障診斷和告警;
算法分析單元,用于利用所述數據模型計算分析所述當前指標數據,獲取系統運行健康狀況,并根據抓取到的異常指標數據觸發故障診斷和告警。
9.根據權利要求6或7所述的基于機器學習的系統故障診斷智能化運維系統,其特征在于,所述故障診斷模塊包括:
初步自檢單元,用于根據機器學習建立的關系圖譜以及異常堆棧標注數據,分別進行自檢,獲取自檢結果;
應用檢查單元,用于利用先前排查問題獲取的決策數據計算故障可能存在的所有原因,并進行相應的檢查,獲取檢查結果;
故障分析單元,用于根據所述自檢結果和所述檢查結果分析出故障原因。
10.根據權利要求9所述的基于機器學習的系統故障診斷智能化運維系統,其特征在于,所述故障診斷模塊還包括:
人工標注單元,用于若是不能自動分析出所述故障原因,則人工介入處理,并對所述異常指標數據進行標注后保存至標注庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于眾安信息技術服務有限公司,未經眾安信息技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910010700.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:補丁安裝失敗的分析方法及裝置
- 下一篇:基于微服務的操作日志記錄收集方法





