[發明專利]故障識別方法、裝置及BMC有效
| 申請號: | 201910703044.3 | 申請日: | 2019-07-31 |
| 公開(公告)號: | CN110489260B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 林震華;陳昊 | 申請(專利權)人: | 新華三技術有限公司成都分公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 劉靜 |
| 地址: | 610000 四川省成都市高新區中國(四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 故障 識別 方法 裝置 bmc | ||
本公開提供一種故障識別方法、裝置及BMC,BMC將服務器觸發的故障事件日志按照不同的故障權重關聯到相應的目標硬件,從而可以根據預設時長內硬件的硬件故障權重之和來判斷該硬件是否出現故障。如此,BMC能夠自行識別服務器中的具體硬件是否發生故障。
技術領域
本公開涉及故障檢測技術領域,具體而言,涉及故障識別方法、裝置及BMC。
背景技術
服務器作為數據中心的重要節點,不僅需要追求穩定可靠的性能,還需具有故障診斷功能。目前,服務器通常配置有基板管理控制器(Baseboard Management Controller,BMC),用于對服務器上各種硬件組件(如,CPU、風扇轉速、系統溫度、電壓、電源、功耗等)的健康狀況進行監控,當監控到異常時,會產生相應的事件日志并記錄。
目前通常采用以下方式進行故障識別:第一,由運維或用戶對記錄的事件日志進行人工分析來排查故障部件;第二,將監控到的數據發送給外部獨立系統進行實時分析,以識別服務器是否存在故障。
然而,第一種方式由于是人工分析,容易出現誤判或漏判的情況;第二種方式需要將監控的數據發送到外網,提高了組網的復雜度。
發明內容
有鑒于此,本公開的目的之一在于提供一種故障識別方法、裝置及BMC,以至少部分地改善上述問題。
為了達到上述目的,本公開采用如下技術方案:
第一方面,本公開提供一種故障識別方法,應用于服務器中的BMC,所述BMC預存有不同的故障事件日志與所述服務器的各個硬件的關聯關系,所述關聯關系包括每個所述硬件與關聯的每個故障事件日志的第一關聯權重;所述方法包括:
當所述服務器觸發目標故障事件日志時,確定與所述目標故障事件日志關聯的目標硬件,以及每個目標硬件與所述目標故障事件日志關聯的第一關聯權重;
根據每個目標硬件部件的第一關聯權重得到該目標硬件部件與所述目標故障事件日志對應的硬件故障權重;
根據所述服務器的硬件在預設時長內的硬件故障權重之和判斷該硬件是否出現故障。
第二方面,本公開提供一種故障識別裝置,應用于服務器中的BMC,所述BMC預存有不同的故障事件日志與所述服務器的各個硬件的關聯關系,所述關聯關系包括每個所述硬件與關聯的每個故障事件日志的第一關聯權重;所述裝置包括:
關聯模塊,用于當所述服務器觸發目標故障事件日志時,確定與所述目標故障事件日志關聯的目標硬件,以及每個目標硬件與所述目標故障事件日志關聯的第一關聯權重;
權重計算模塊,用于根據每個目標硬件部件的第一關聯權重得到該目標硬件部件與所述目標故障事件日志對應的硬件故障權重;
故障確定模塊,用于根據所述服務器的硬件在預設時長內的硬件故障權重之和判斷該硬件是否出現故障。
第三方面,本公開提供一種BMC,包括處理器及可讀存儲介質,所述可讀存儲介質存儲有機器可執行指令,所述機器可執行指令被執行時促使所述處理器實現本公開第一方面提供的故障識別方法。
第四方面,本公開提供一種可讀存儲介質,其上存儲有機器可執行指令,所述機器可執行指令被執行時,實現本公開第一方面提供的故障識別方法。
相較于現有技術,本公開提供的一種故障識別方法、裝置及BMC,通過將服務器觸發的故障事件日志按照不同的硬件故障權重關聯到相應的目標硬件,從而可以根據服務器的硬件在預設時長內的硬件故障權重之和來判斷該硬件是否出現故障。如此,BMC能夠自行識別服務器中的具體硬件是否發生故障。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新華三技術有限公司成都分公司,未經新華三技術有限公司成都分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910703044.3/2.html,轉載請聲明來源鉆瓜專利網。





