[發明專利]一種分布式存儲集群的硬盤故障處理方法、系統及裝置在審
| 申請號: | 201911149378.7 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN111104239A | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 張大帥 | 申請(專利權)人: | 北京浪潮數據技術有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 侯珊 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分布式 存儲 集群 硬盤 故障 處理 方法 系統 裝置 | ||
1.一種分布式存儲集群的硬盤故障處理方法,其特征在于,應用于包含多個存儲服務器的分布式存儲集群,包括:
獲取每個所述存儲服務器中各硬盤的讀寫IO時延信息;
根據目標硬盤的讀寫IO時延信息判斷所述目標硬盤是否出現故障;其中,所述目標硬盤為各所述硬盤中任一硬盤;
若是,則將所述目標硬盤從所述分布式存儲集群中進行隔離。
2.如權利要求1所述的分布式存儲集群的硬盤故障處理方法,其特征在于,所述根據目標硬盤的讀寫IO時延信息判斷所述目標硬盤是否出現故障的過程,包括:
根據目標硬盤的讀寫IO時延信息判斷所述目標硬盤是否出現讀寫IO中斷;
若是,則確定所述目標硬盤出現故障。
3.如權利要求2所述的分布式存儲集群的硬盤故障處理方法,其特征在于,所述根據各所述硬盤的讀寫IO時延信息相應判斷各所述硬盤是否出現故障的過程,還包括:
根據目標硬盤的讀寫IO時延信息判斷所述目標硬盤的讀寫IO時延是否連續N次超過預設時間閾值;其中,N為正整數;
若是,則確定所述目標硬盤出現故障。
4.如權利要求1所述的分布式存儲集群的硬盤故障處理方法,其特征在于,所述將所述目標硬盤從所述分布式存儲集群中進行隔離的過程,包括:
將所述目標硬盤所在的存儲服務器開啟維護模式,并將所述目標硬盤對應的OSD服務從所述分布式存儲集群中移除。
5.如權利要求1所述的分布式存儲集群的硬盤故障處理方法,其特征在于,所述硬盤故障處理方法還包括:
在判斷出所述目標硬盤出現故障后,向上層管理設備發送所述目標硬盤的故障信息。
6.如權利要求5所述的分布式存儲集群的硬盤故障處理方法,其特征在于,所述向上層管理設備發送所述目標硬盤的故障信息的過程,包括:
根據預設管理郵箱和/或預設手機號碼和/或snmp Trap客戶端的IP地址,向所述預設管理郵箱發送告警郵件和/或向所述預設手機號碼發送告警短信和/或向所述snmp Trap客戶端發送告警信息。
7.一種分布式存儲集群的硬盤故障處理系統,其特征在于,應用于包含多個存儲服務器的分布式存儲集群,包括:
OSD服務模塊,用于獲取每個所述存儲服務器中各硬盤的讀寫IO時延信息;
磁盤檢測模塊,用于根據目標硬盤的讀寫IO時延信息判斷所述目標硬盤是否出現故障;若是,則將所述目標硬盤從所述分布式存儲集群中進行隔離;其中,所述目標硬盤為各所述硬盤中任一硬盤。
8.如權利要求7所述的分布式存儲集群的硬盤故障處理系統,其特征在于,所述根據目標硬盤的讀寫IO時延信息判斷所述目標硬盤是否出現故障的過程,包括:
根據目標硬盤的讀寫IO時延信息,判斷所述目標硬盤是否出現讀寫IO中斷或所述目標硬盤的讀寫IO時延是否連續N次超過預設時間閾值;
若是,則確定所述目標硬盤出現故障。
9.如權利要求7所述的分布式存儲集群的硬盤故障處理系統,其特征在于,所述將所述目標硬盤從所述分布式存儲集群中進行隔離的過程,包括:
將所述目標硬盤所在的存儲服務器開啟維護模式,并將所述目標硬盤對應的OSD服務從所述分布式存儲集群中移除。
10.一種分布式存儲集群的硬盤故障處理裝置,其特征在于,包括:
存儲器,用于存儲計算機程序;
處理器,用于在執行所述計算機程序時實現如權利要求1-6任一項所述的分布式存儲集群的硬盤故障處理方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京浪潮數據技術有限公司,未經北京浪潮數據技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911149378.7/1.html,轉載請聲明來源鉆瓜專利網。





