[發明專利]一種硬盤故障的檢測方法及裝置有效
| 申請號: | 201310344369.X | 申請日: | 2013-08-08 |
| 公開(公告)號: | CN103455395A | 公開(公告)日: | 2013-12-18 |
| 發明(設計)人: | 虞旭林 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F11/22 | 分類號: | G06F11/22;G06F11/30 |
| 代理公司: | 廣州三環專利代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 硬盤 故障 檢測 方法 裝置 | ||
技術領域
本發明涉及存儲技術領域,尤其涉及一種硬盤故障的檢測方法及裝置。
背景技術
隨著技術的發展,服務器上串行高級技術附件(Serial?Advanced?Technology?Attachment,SATA)硬盤的單盤容量越來越大,單盤可以存儲的硬盤的數據越來越多,而其故障率卻并未有顯著的下降,當前SATA硬盤的年故障率仍處在一個較高的水平。
針對SATA硬盤故障,可以分為不可預測性故障和可預測性故障,不可預測性故障是指硬盤由于使用不當等因素而導致的瞬間損壞,這種故障發生于瞬間,難以進行有效的監控和防范。可預測性故障是指由于硬盤的長期使用而導致的機械磨損或磁介質表面的退化,這個過程是一個長期的可監控的變化過程。
對于可預測性故障,目前有一套已經設定為工業標準的檢測技術,即自我監測、分析及報告技術(Self-Monitoring?Analysis?and?Reporting?Technology,S.M.A.R.T),主要用于保障硬盤的數據安全,硬盤通過該技術可以自我監控滋生的溫度、讀寫錯誤率、壞塊數量以及錯誤日志等。目前對S.M.A.R.T.的檢測可以通過標準的協議編寫應用程序,在操作系統上層通過應用程序檢查硬盤的S.M.A.R.T是否處于Failed狀態來判斷硬盤的健康狀態。
由于不可預測性故障故障的不可預測性,因此只能在設備的設計和使用時按照硬盤的要求使用。但是還是不可避免的會發生這類故障,目前的故障處理方案上操作系統帶內監控工具可以監控到硬盤的丟失,監控軟件發現硬盤丟失之后會進行硬盤丟失告警,但是無法隔離這種故障。而這類不可預測性故障可能會導致硬盤變得很慢,同時也會存在不停的被硬盤控制器找到再丟失情況,造成系統的不穩定甚至導致系統業務的中斷。
對于可預測故障要求必須在有操作系統的情況下進行檢測,且需要在操作系統業務下安裝硬盤狀態監控軟件,在大規模集群的服務器上,僅僅增加一個監控軟件是不夠的,還需要該監控軟件定時上報硬盤的健康狀態,在大規模部署服務器的數據中心,還需要考慮集中管理問題,因此增加了業務部署的復雜度。而且在標準的S.M.A.R.T技術中僅僅憑借Failed位的狀態判斷硬盤的好壞過于粗略,難以準確判斷硬盤將要故障的趨勢。
因此,如何簡化硬盤狀態的監控操作、檢測硬盤的不可預測性故障已成為業界迫切需要解決的問題。
發明內容
有鑒于此,本發明提供一種硬盤故障的檢測方法及裝置,用以解決現有技術中存在著的硬盤狀態監控操作復雜、不能檢測到硬盤的不可預測性故障的技術問題。
第一方面,本發明提供了一種硬盤故障的檢測方法,包括:
當從硬盤控制器檢測到的硬盤組中的其中一個硬盤的第一故障信息與從外接于所述硬盤的硬盤在位檢測電路獲取的所述硬盤的第一在位信息不一致時,重啟所述硬盤;
重新從所述硬盤控制器獲取所述硬盤的第二故障信息和從所述硬盤在位檢測電路獲取所述硬盤的第二在位信息,當所述第二故障信息和所述第二在位信息不一致時,確定所述硬盤發生第一類型的故障。
在第一種可能的實現方式中,所述確定所述硬盤發生第一類型的故障之后,所述方法還包括:
將所述硬盤從所述硬盤組中隔離。
結合第一方面,在第二種可能的實現方式中,所述方法還包括:
當所述第一故障信息與所述第一在位信息一致或當所述第二故障信息與所述第二在位信息一致時,確定所述硬盤發生第二類型的故障。
結合第一方面的第二種可能的實現方式,在第三種可能的實現方式中,所述確定所述硬盤發生第二類型的故障之后,所述方法還包括:
從所述硬盤控制器檢測第二類型的故障監控值是否到達預警值;
當檢測的結果為是時,發出硬盤故障預警。
結合第一方面的第三種可能的實現方式,在第四種可能的實現方式中,所述確定所述硬盤發生第二類型的故障之后,所述方法還包括:
當檢測的結果為否時,測試所述硬盤組的工作溫度是否高于預設溫度;
當測試的結果為是時,調節所述硬盤組的風扇轉速;
當測試的結果為否時,從所述硬盤控制器獲取統計的所述硬盤的壞塊數量;
當所述硬盤的壞塊數量超出設定值時,發出所述硬盤故障預警。
第二方面,本發明提供了一種硬盤故障的檢測裝置,包括:
第一獲取單元,用于從硬盤控制器獲取硬盤組中的其中一個硬盤的第一故障信息,以及從外接于所述硬盤的硬盤在位檢測電路獲取所述硬盤的第一在位信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310344369.X/2.html,轉載請聲明來源鉆瓜專利網。





