[發明專利]用于服務器集群故障診斷的處理方法、處理裝置、及處理設備、用于服務器故障診斷的方法及計算機可讀存儲介質有效
| 申請號: | 202110322834.4 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN112988444B | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 曾令新;林哲偉;嚴勇;李小龍 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06F11/30 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 王娟 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 服務器 集群 故障診斷 處理 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
公開了一種用于服務器集群故障診斷的處理方法、處理裝置、處理設備、和計算機可讀存儲介質。本公開的實施例通過對造成自動診斷失敗的故障類型進行梳理,將由于信息不全或多部件報錯導致無法自動診斷的故障通過診斷失敗信息進行實時上報并進入自動化處理流程,從而使得自動診斷失敗故障處理更加快速且高效。此外,該處理方法通過在歷史操作信息中基于診斷失敗信息所包含的關鍵字來實現對自動診斷結果的區分與統計,提高了數據統計的可行性,并且通過線上系統對接服務器供應商以進行數據的實時反饋與記錄,有利于服務器后續版本的自動診斷能力的提升和優化。
技術領域
本公開涉及服務器集群管理工具領域,并且更具體地,涉及一種用于服 務器集群故障診斷的處理方法、處理裝置、處理設備和計算機可讀存儲介質。
背景技術
隨著服務器在各種應用場景中的重要作用所帶來的服務器保有量的增加, 在服務器不斷負載運行的同時,不可避免地會出現各種故障問題。例如,處 理器內部錯誤引起的服務器故障可能導致諸如服務器死機、異常重啟等問題。 因此,如何有效發現并解決服務器故障問題,即對服務器故障進行自動化識 別與處理,對于服務器的正常運行來說非常重要。
其中,隨著服務器中硬件故障自動明確化率的提升,對于導致自動診斷 失敗的故障也愈發關注,然而,由于當前故障自動診斷失敗或成功時,服務 器均輸出指示故障報錯的日志,而自動診斷失敗的故障相較于自動診斷成功 的故障所輸出的日志并無相應的顯式指示,造成服務器運維人員無法監控自 動診斷失敗的故障,而是需要對發生故障的所有服務器進行逐臺分析以確定 發生自動診斷失敗故障的服務器,給海量服務器運營帶來了極大不便。此外, 為了提升自動診斷成功率,需要收集并統計自動診斷失敗的案例并反饋至服 務器供應商,但是由于難以通過日志快速確定這些案例,而是需要通過窮舉 所有指示故障報錯的日志來從中確定失敗的比例,也為數據統計帶來一定挑 戰。
因此,需要一種能夠快速高效識別并處理自動診斷失敗故障的方法。
發明內容
為了解決上述問題,本公開通過將自動診斷失敗的故障通過診斷失敗信 息進行實時上報并進入自動化處理流程,從而使得自動診斷失敗故障處理更 加快速且高效。
本公開的實施例提供了涉及一種用于服務器集群故障診斷的處理方法、 處理裝置、處理設備、和計算機可讀存儲介質。
本公開的實施例提供了一種用于服務器集群故障診斷的處理方法,包括: 響應于所述服務器集群中出現發生災難性故障的服務器,在所述服務器中執 行自動診斷;在所述自動診斷失敗的情況下,在所述服務器輸出的實時操作 信息中添加診斷失敗信息,其中,所述診斷失敗信息包括與所述自動診斷失 敗對應的診斷失敗關鍵字,并且所述診斷失敗關鍵字用于指示所述災難性故 障;基于所述診斷失敗信息中的所述診斷失敗關鍵字,從所述實時操作信息 中篩選出所述診斷失敗信息,并對所述診斷失敗信息進行分析;以及基于分 析結果,確定對所述服務器的所述故障的處理方式。
本公開的實施例提供了一種用于服務器故障診斷的方法,包括:響應于 所述服務器發生災難性故障,在所述服務器中執行自動診斷;以及在所述自 動診斷失敗的情況下,在所述服務器輸出的實時操作信息中添加診斷失敗信 息,其中,所述診斷失敗信息包括與所述自動診斷失敗對應的診斷失敗關鍵 字,并且所述診斷失敗關鍵字用于指示所述災難性故障。
本公開的實施例提供了一種用于服務器集群故障診斷的處理方法,包括: 從所述服務器集群中所包括的至少一個發生災難性故障的服務器接收實時操 作信息,其中,所述實時操作信息中包括診斷失敗信息,所述診斷失敗信息 包括與所述自動診斷失敗對應的診斷失敗關鍵字,并且所述診斷失敗關鍵字 用于指示所述災難性故障;基于所述診斷失敗信息中的所述診斷失敗關鍵字, 從所述實時操作信息中篩選出所述診斷失敗信息,并對所述診斷失敗信息進 行分析;以及基于分析結果,確定對所述服務器的所述故障的處理方式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110322834.4/2.html,轉載請聲明來源鉆瓜專利網。





