[發(fā)明專利]分布式存儲系統(tǒng)的磁盤故障處理方法、裝置及服務(wù)器有效
| 申請?zhí)枺?/td> | 202210298450.8 | 申請日: | 2022-03-25 |
| 公開(公告)號: | CN114415970B | 公開(公告)日: | 2022-06-17 |
| 發(fā)明(設(shè)計)人: | 甘紅星 | 申請(專利權(quán))人: | 北京金山云網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06;G06F11/07 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 董艷芳 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分布式 存儲系統(tǒng) 磁盤 故障 處理 方法 裝置 服務(wù)器 | ||
1.一種分布式存儲系統(tǒng)的磁盤故障處理方法,其特征在于,所述方法應(yīng)用于分布式存儲系統(tǒng)的數(shù)據(jù)節(jié)點,所述數(shù)據(jù)節(jié)點配置有至少一個磁盤,每個所述磁盤均包括至少一個數(shù)據(jù)塊,所述分布式存儲系統(tǒng)還包括管理節(jié)點,所述方法包括:
當檢測到觸發(fā)數(shù)據(jù)塊異常事件時,向所述管理節(jié)點發(fā)送所述數(shù)據(jù)塊異常事件對應(yīng)的第一移除命令,以移除所述管理節(jié)點內(nèi)存儲的故障數(shù)據(jù)塊對應(yīng)的數(shù)據(jù)塊信息;其中,所述第一移除命令攜帶有所述故障數(shù)據(jù)塊的數(shù)據(jù)塊標識;
接收所述管理節(jié)點發(fā)送的第二移除命令;
移除所述數(shù)據(jù)節(jié)點內(nèi)存儲的所述故障數(shù)據(jù)塊對應(yīng)的數(shù)據(jù)塊信息,并基于所述故障數(shù)據(jù)塊對應(yīng)的存儲副本屏蔽所述故障數(shù)據(jù)塊;其中,所述存儲副本存儲在所述故障數(shù)據(jù)塊所屬磁盤中;
所述基于所述故障數(shù)據(jù)塊對應(yīng)的存儲副本屏蔽所述故障數(shù)據(jù)塊的步驟,包括:對所述故障數(shù)據(jù)塊的存儲副本執(zhí)行重命名操作得到重命名副本,并將所述重命名副本存儲至指定路徑;其中,所述指定路徑設(shè)置于所述故障數(shù)據(jù)塊所屬磁盤。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述將所述重命名副本存儲至指定路徑的步驟之后,所述方法包括:
統(tǒng)計所述指定路徑中存儲的所述重命名副本的副本數(shù)量;
判斷所述副本數(shù)量是否大于預(yù)設(shè)數(shù)量閾值;
如果是,將所述故障數(shù)據(jù)塊所屬磁盤確定為故障磁盤,并屏蔽所述故障磁盤。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述屏蔽所述故障磁盤的步驟,包括:
向所述管理節(jié)點發(fā)送磁盤異常事件對應(yīng)的第三移除命令,以移除所述管理節(jié)點內(nèi)存儲的所述故障磁盤對應(yīng)的磁盤信息;其中,所述第三移除命令攜帶有所述故障磁盤的磁盤標識;
接收所述管理節(jié)點發(fā)送的第四移除命令;
移除所述數(shù)據(jù)節(jié)點內(nèi)存儲的所述故障磁盤對應(yīng)的磁盤信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述當檢測到觸發(fā)數(shù)據(jù)塊異常事件時,向所述管理節(jié)點發(fā)送所述數(shù)據(jù)塊異常事件對應(yīng)的第一移除命令的步驟之前,所述方法還包括:
如果監(jiān)聽到針對于所述數(shù)據(jù)塊的指定操作,生成第一校驗碼;
判斷所述第一校驗碼與所述數(shù)據(jù)塊對應(yīng)的第二校驗碼是否一致;
如果否,將所述數(shù)據(jù)塊確定為故障數(shù)據(jù)塊,并觸發(fā)數(shù)據(jù)塊異常事件。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述基于所述故障數(shù)據(jù)塊對應(yīng)的存儲副本屏蔽所述故障數(shù)據(jù)塊的步驟之后,所述方法還包括:
生成所述故障數(shù)據(jù)塊對應(yīng)的第一屏蔽結(jié)果,并將所述第一屏蔽結(jié)果發(fā)送至所述管理節(jié)點,以使所述管理節(jié)點針對所述故障數(shù)據(jù)塊執(zhí)行恢復(fù)操作。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,在所述移除所述數(shù)據(jù)節(jié)點內(nèi)存儲的所述故障磁盤對應(yīng)的磁盤信息的步驟之后,所述方法包括:
生成所述故障磁盤對應(yīng)的第二屏蔽結(jié)果,并將所述第二屏蔽結(jié)果發(fā)送至所述管理節(jié)點,以使所述管理節(jié)點針對所述故障磁盤執(zhí)行恢復(fù)操作。
7.一種分布式存儲系統(tǒng)的磁盤故障處理裝置,其特征在于,所述裝置應(yīng)用于分布式存儲系統(tǒng)的數(shù)據(jù)節(jié)點,所述數(shù)據(jù)節(jié)點配置有至少一個磁盤,每個所述磁盤均包括至少一個數(shù)據(jù)塊,所述分布式存儲系統(tǒng)還包括管理節(jié)點,所述裝置包括:
命令發(fā)送模塊,當檢測到觸發(fā)數(shù)據(jù)塊異常事件時,向所述管理節(jié)點發(fā)送所述數(shù)據(jù)塊異常事件對應(yīng)的第一移除命令,以移除所述管理節(jié)點內(nèi)存儲的故障數(shù)據(jù)塊對應(yīng)的數(shù)據(jù)塊信息;其中,所述第一移除命令攜帶有所述故障數(shù)據(jù)塊的數(shù)據(jù)塊標識;
命令接收模塊,接收所述管理節(jié)點發(fā)送的第二移除命令;
故障屏蔽模塊,移除所述數(shù)據(jù)節(jié)點內(nèi)存儲的所述故障數(shù)據(jù)塊對應(yīng)的數(shù)據(jù)塊信息,并基于所述故障數(shù)據(jù)塊對應(yīng)的存儲副本屏蔽所述故障數(shù)據(jù)塊;其中,所述存儲副本存儲在所述故障數(shù)據(jù)塊所屬磁盤中;
所述故障屏蔽模塊還用于:對所述故障數(shù)據(jù)塊的存儲副本執(zhí)行重命名操作得到重命名副本,并將所述重命名副本存儲至指定路徑;其中,所述指定路徑設(shè)置于所述故障數(shù)據(jù)塊所屬磁盤。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京金山云網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京金山云網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210298450.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 用于處理到遠程存儲位置的故障恢復(fù)的方法、系統(tǒng)以及程序
- 包括向外擴展型存儲系統(tǒng)的存儲系統(tǒng)群及其管理方法
- 一種移動存儲系統(tǒng)及其存儲方法
- 存儲系統(tǒng)的數(shù)據(jù)備份與恢復(fù)系統(tǒng)、方法、設(shè)備及存儲介質(zhì)
- 在線遷移異構(gòu)系統(tǒng)數(shù)據(jù)的方法、裝置、設(shè)備和存儲介質(zhì)
- 建立存儲系統(tǒng)伙伴關(guān)系的方法及裝置
- 數(shù)據(jù)處理系統(tǒng)及其操作方法
- 一種容災(zāi)平臺及一種容災(zāi)方法
- 在基于云的存儲系統(tǒng)中服務(wù)I/O操作
- 一種數(shù)據(jù)修復(fù)方法及裝置





