[發明專利]一種服務器硬件故障的自診斷方法在審
| 申請號: | 201410173467.6 | 申請日: | 2014-04-28 |
| 公開(公告)號: | CN103970635A | 公開(公告)日: | 2014-08-06 |
| 發明(設計)人: | 薛廣營;李博樂;陳彥靈 | 申請(專利權)人: | 浪潮電子信息產業股份有限公司 |
| 主分類號: | G06F11/26 | 分類號: | G06F11/26;G06F11/273 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250014 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 服務器 硬件 故障 診斷 方法 | ||
技術領域
本發明涉及硬件診斷領域,具體地說是一種服務器硬件故障的自診斷方法。
背景技術
服務器系統的設計越來越復雜,一塊服務器主板上元器件往往有數千之多,當主板出現硬件故障時,工程師往往需要大量的數據測量并進行詳細的分析才能定位到故障位置,這將是一個非常復雜的工作。
對于服務器系統而言,板級硬件故障最常見的問題是時序異常,電壓異常,芯片散熱異常,芯片工作狀態異常。因此,常規的故障排查方法為用示波器逐級測量上電時序,萬用表逐點測量電平準位,借助熱測量設備評估關鍵芯片的散熱狀況,并對關鍵芯片的工作狀態進行測量分析,然后綜合分析得出結論。服務器系統主板上電時序復雜,電平類型眾多,元器件數量龐雜,工程師往往需要花費大量的時間進行信號量測才能定位到故障。
服務器系統對可靠性要求極高,一般而言,服務器設計通常采用CPLD/FPGA控制時序,對各電平值和溫度信息也都有偵測,為便于處理故障,關鍵芯片的工作狀態也都有監控,因此合理利用這些偵測信息,可以大幅提升故障定位效率,減少工程師工作量。
發明內容
本發明提出一種服務器硬件故障的自診斷方法,改進了傳統的儀器測量,人工分析定位故障方式,提升工作效率。
本發明提供的服務器硬件故障診斷方法主要包括以下技術點:① 電參數偵測 ② 故障分析 ③ 故障輸出。利用服務器系統內的時序控制模塊,信號采集模塊和系統管理模塊,對系統的硬件故障進行自診斷,并通過系統管理接口輸出硬件故障信息,方便工程師快速定位。
包括電壓溫度偵測模塊、時序控制模塊、信號采集模塊、IC工作狀態偵測、故障診斷中心和故障輸出單元,
① 電壓溫度偵測模塊:偵測主板各電平準位以及熱敏點的溫度情況;
②時序控制模塊:為控制系統上電時序;
③IC工作狀態偵測:IC工作狀態偵測通常偵測IC的Error或者Alert#,Alarm#等異常輸出信號,一般情況下由BMC或者SMC完成;
④故障診斷中心:故障診斷中心負責收集電壓溫度信息,IC工作狀態信息,同時根據時序控制信號情況對各IC工作狀態作出綜合診斷,并依據預先存儲的數據庫信息給出故障類型,故障點位置,故障排查優先級。
⑤故障輸出單元:故障輸出單元是服務器硬件故障自診斷的人機交互接口,其形式可以是串口終端或者web界面,取決于故障診斷中心的接口形式;
實施步驟如下:
①故障診斷中心獲取系統偵測點溫度電壓信息;
②故障診斷中心獲取系統時序控制模塊輸入輸出信息;
③故障診斷中心獲取IC工作狀態信息;
④故障診斷中心根據收集的信息和故障數據庫信息作出故障自診斷;
⑤用戶通過故障輸出接口索取系統硬件故障診斷信息,完成故障定位和故障維修。
本發明的有益效果是:
改進了傳統的儀器測量,人工分析定位故障方式,可對系統的硬件故障進行自診斷,并通過系統管理接口輸出硬件故障信息,方便工程師快速定位。相對于傳統的通過示波器和萬用表等測量儀器進行定位,可以大大減少工作量,提升工作效率。
附圖說明
附圖1是本發明的系統架構圖。
具體實施方式
參照具體實施例對本發明作以下詳細地說明。
圖中各模塊的主要功能及實現方式如下:
① 電壓溫度偵測模塊:電壓溫度偵測模塊一般由Hardware Monitor芯片(比如W83795)或者AD轉換芯片完成,其主要功能是偵測主板各電平準位以及熱敏點的溫度情況;
②時序控制模塊:時序控制模塊一般由CPLD或者FPGA完成,其主要功能為控制系統上電時序;
③IC工作狀態偵測:IC工作狀態偵測通常偵測IC的Error或者Alert#,Alarm#等異常輸出信號,一般情況下由BMC或者SMC完成;
④故障診斷中心:故障診斷中心負責收集電壓溫度信息,IC工作狀態信息,同時根據時序控制信號情況對各IC工作狀態作出綜合診斷,并依據預先存儲的數據庫信息給出故障類型,故障點位置,故障排查優先級。故障診斷中心一般由BMC或者SMC承擔。
⑤故障輸出單元:故障輸出單元是服務器硬件故障自診斷的人機交互接口,其形式可以是串口終端或者web界面,取決于故障診斷中心的接口形式。
該設計的具體實施步驟如下:
①故障診斷中心獲取系統偵測點溫度電壓信息;
②故障診斷中心獲取系統時序控制模塊輸入輸出信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮電子信息產業股份有限公司,未經浪潮電子信息產業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410173467.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有攝像功能的智能頭盔
- 下一篇:帶防煙塵濕巾口罩的工作帽





