[發明專利]故障檢測方法及裝置在審
| 申請號: | 201410728441.3 | 申請日: | 2014-12-03 |
| 公開(公告)號: | CN104536855A | 公開(公告)日: | 2015-04-22 |
| 發明(設計)人: | 田洪元;胡遠明;李其責;夏嵩;王衛鋼 | 申請(專利權)人: | 曙光信息產業(北京)有限公司 |
| 主分類號: | G06F11/22 | 分類號: | G06F11/22 |
| 代理公司: | 北京德恒律治知識產權代理有限公司 11409 | 代理人: | 章社杲;盧軍峰 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 故障 檢測 方法 裝置 | ||
技術領域
本發明涉及計算機領域,具體來說,涉及一種故障檢測方法及裝置。
背景技術
隨著大數據時代的到來,以及數據的爆炸式增長,作為信息存儲的媒介,硬盤的部署量也呈現出爆炸式增長。隨著硬盤的大量部署,硬盤的故障率也急劇上升,其中最嚴重的故障就是硬盤突然掉線,用戶以及系統無法對硬盤進行訪問。而根據大量的維護數據,80%出現突然掉線的硬盤經硬盤廠商進行專業檢測后,并未發現硬盤不良。而對這些硬盤進行一次下電,上電過程后,硬盤即可正常工作。在服務器不中斷服務的前提下,針對上述可恢復的硬盤進行故障恢復操作,是業內一個技術難點。
現有技術中,通常是當硬盤掉線后,先將硬盤從服務器上拔除,然后再插入,完成一次對硬盤的上/下電過程,讓硬盤恢復正常工作。然而現代數據中心中可能部署數十萬塊硬盤,且服務器機房管理日益智能化,一個數據中心,只配備少量管理員,對于每次硬盤掉線,都由管理員對硬盤進行插拔動作,在反映速度以及操作上都是一個巨大的挑戰。
針對相關技術中的問題,目前尚未提出有效的解決方案。
發明內容
針對相關技術中的問題,本發明提出一種故障檢測方法,能夠自動檢測出掉線的硬盤。
本發明的技術方案是這樣實現的:
根據本發明的一個方面,提供了一種故障檢測方法。
該故障檢測方法包括:
偵測各個硬盤的硬盤狀況信息并將所述硬盤狀況信息進行匯總;
通過管理接口將匯總后的信息發送至基板管理控制器;
所述基板管理控制器通過與所述各個硬盤一一對應的通用輸入輸出接口偵測所述各個硬盤的硬盤狀況信息;
所述基板管理控制器將通過通用輸入輸出接口偵測到的硬盤狀況信息與所述匯總后的信息進行比較,判斷所述各個硬盤是否發生故障。
其中,當所述基板管理控制器通過通用輸入輸出接口偵測到的硬盤狀況信息與所述匯總后的信息不一致時,所述基板管理控制器根據發生變化的硬盤狀況信息確定發生故障的硬盤。
其中,所述基板管理控制器通過所述發生故障的硬盤對應的通用輸入輸出接口對所述發生故障的硬盤進行上電或下電操作。
其中,當所述基板管理控制器完成所述上電或下點操作后,將所述上電或下電的操作流程生成任務日志。
此外,每個硬盤都由屬于自身對應的獨立的供電裝置對其供電。
根據本發明的另一方面還提供了一種故障檢測裝置,包括:
第一偵測模塊,用于偵測各個硬盤的硬盤狀況信息并將所述硬盤狀況信息進行匯總;
發送模塊,用于通過管理接口將匯總后的信息發送至基板管理控制器;
第二偵測模塊,所述基板管理控制器通過與所述各個硬盤一一對應的通用輸入輸出接口偵測所述各個硬盤的硬盤狀況信息;
判斷模塊,用于所述基板管理控制器將通過通用輸入輸出接口偵測到的硬盤狀況信息與所述匯總后的信息進行比較,判斷所述各個硬盤是否發生故障。
該裝置還包括:確定模塊,用于當所述基板管理控制器通過通用輸入輸出接口偵測到的硬盤狀況信息與所述匯總后的信息不一致時,所述基板管理控制器根據發生變化的硬盤狀況信息確定發生故障的硬盤。
該裝置還包括:供電模塊,用于所述基板管理控制器通過所述發生故障的硬盤對應的通用輸入輸出接口對所述發生故障的硬盤進行上電或下電操作。
該裝置還包括:生成模塊,用于當所述基板管理控制器完成所述上電或下點操作后,將所述上電或下電的操作流程生成任務日志。
該裝置還包括:電源,每個硬盤都由屬于自身對應的獨立的電源對其供電。
本發明通過將收集到的硬盤狀況信息進行匯總,并且基板管理控制器實時偵測各個硬盤的硬盤狀況信息,并將其與匯總后的信息進行比較從而判斷出發生掉線的硬盤,本發明的技術方案工作流程簡單方便,并且完全智能化不需要人工干預,大大減輕了服務器管理員的工作,提高了系統的可用性。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是根據本發明實施例的故障檢測方法的流程圖;
圖2是根據本發明實施例的故障檢測方法的示意圖;
圖3是根據本發明實施例的故障檢測裝置的框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曙光信息產業(北京)有限公司,未經曙光信息產業(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410728441.3/2.html,轉載請聲明來源鉆瓜專利網。





