[發明專利]一種基于IO負載大小的硬盤健康狀態估計方法在審
| 申請號: | 202010576017.7 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111782143A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 鄧玲;田鵬;陜振;宋珺 | 申請(專利權)人: | 北京計算機技術及應用研究所 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06;G06N20/00 |
| 代理公司: | 中國兵器工業集團公司專利中心 11011 | 代理人: | 張然 |
| 地址: | 100854*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 io 負載 大小 硬盤 健康 狀態 估計 方法 | ||
本發明涉及計算機存儲技術領域,具體一種基于IO負載大小的硬盤健康狀態估計方法包括:步驟一、進行硬盤樣本的篩選;步驟二、計算健康度;步驟三、將步驟二中計算好的健康度標記在對應的硬盤樣本上;步驟四、根據標記好的硬盤樣本進行訓練。本發明保證了對質量合格硬盤的健康度進行估計時有較高精度。同時,在對健康度算法參數的不斷調節中,可找到最佳的表征硬盤健康狀態的健康度算法,對和訓練集同型號或近似型號硬盤的健康度有高準確度估計效果。
技術領域
本發明涉及計算機存儲技術領域,具體涉及一種基于IO負載大小的硬盤健康狀態估計方法。
背景技術
隨著云存儲技術的不斷發展和進步,存儲系統中硬盤數量不斷增多、硬盤的容量也越來越大。在存儲系統中,硬盤的數量遠遠多于其它器件,發生故障的風險就更大,硬盤故障影響著存儲系統的可靠性。準確的硬盤健康狀態監測有助于存儲系統的運維,提高系統的可靠性。為保證硬盤健康狀態估計算法的準確度,目前主流技術是利用硬盤報告的smart數據和機器學習算法,主要采用二分類、健康度和剩余使用壽命三種方式來度量硬盤健康狀態。
二分類策略是將硬盤的健康狀態分為兩類:硬盤失效前一段時間的樣本為正例,其余樣本為反例;健康度是將硬盤失效前一段時間的樣本按時間順序分為幾類,越是接近硬盤失效的樣本健康度越低;剩余使用定義為硬盤當前時刻到失效時的時間長度,它是一條斜率為1的直線。雖然每一種度量方式都有一定效果,但這三種度量方式原理是建立在硬盤的剩余使用壽命變化是一條斜率為1的曲線的基礎上。事實上,不論是利用特征的重要性分析方法還是常識判斷,硬盤的剩余使用壽命嚴重受IO負載影響,因此它不可能是一條直線。所以這三種度量方式在原理上有一定缺陷,即使利用機器學習算法實現也很難達到工程應用的精度,因此需要找到一種更加合理的度量方式來度量硬盤健康狀態。
發明內容
本發明的目的在于提供一種基于IO負載大小的硬盤健康狀態估計方法,用于解決無法精確度量硬盤健康狀態,并無法合適的機器學習算法進行學習和估計的問題。
本發明一種基于IO負載大小的硬盤健康狀態估計方法,其中,包括:步驟一、進行硬盤樣本的篩選;步驟二、計算健康度,包括:基于IO負載大小的健康度適用于硬盤整個生命周期,計算公式包括:
其中,Dt表示t時刻硬盤的健康程度,取值范圍為[0,100],為t時刻之后硬盤在未來的IO負載量,RWtotal為硬盤在失效時IO負載的總量;
其中,V241、V242分別表示SMART屬性ID為241和242的值,u241和u242分別表示ID為241和242的權重;
RW=V240 (式3);
其中,V240分別表示SMART屬性ID為240的值;
步驟三、將步驟二中計算好的健康度標記在對應的硬盤樣本上;
步驟四、根據標記好的硬盤樣本進行訓練。
對于本發明的方法的一實施例,其中,式1中RW的計算依賴于硬盤報告的SMART屬性中ID為240、241以及242的值。
對于本發明的方法的一實施例,其中,式2是基于ID為241和242的RW計算方法。
對于本發明的方法的一實施例,其中,式3是基于ID為240的RW計算公式。
對于本發明的方法的一實施例,其中,在步驟二中,計算硬盤健康度是基于硬盤報告的與IO負載相關的SMART屬性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京計算機技術及應用研究所,未經北京計算機技術及應用研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010576017.7/2.html,轉載請聲明來源鉆瓜專利網。





