[發(fā)明專利]分布式存儲(chǔ)系統(tǒng)的故障處理方法及裝置、電子設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 202010463289.6 | 申請(qǐng)日: | 2020-05-27 |
| 公開(公告)號(hào): | CN111628893B | 公開(公告)日: | 2022-07-12 |
| 發(fā)明(設(shè)計(jì))人: | 肖永玲;劉名欣;張旭明;王豪邁;胥昕 | 申請(qǐng)(專利權(quán))人: | 北京星辰天合科技股份有限公司 |
| 主分類號(hào): | H04L41/0659 | 分類號(hào): | H04L41/0659;H04L67/1097;G06F11/07 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 周春枚 |
| 地址: | 100094 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分布式 存儲(chǔ)系統(tǒng) 故障 處理 方法 裝置 電子設(shè)備 | ||
1.一種分布式存儲(chǔ)系統(tǒng)的故障處理方法,其特征在于,應(yīng)用于預(yù)設(shè)分布式存儲(chǔ)系統(tǒng),所述預(yù)設(shè)分布式存儲(chǔ)系統(tǒng)包括多個(gè)數(shù)據(jù)中心,每個(gè)所述數(shù)據(jù)中心包括多個(gè)數(shù)據(jù)落盤進(jìn)程OSD,所述故障處理方法包括:
在確定目標(biāo)數(shù)據(jù)中心之間出現(xiàn)網(wǎng)絡(luò)故障時(shí),利用所述目標(biāo)數(shù)據(jù)中心中的預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD檢測(cè)是否出現(xiàn)區(qū)域級(jí)別故障,其中,利用所述目標(biāo)數(shù)據(jù)中心中的預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD檢測(cè)是否出現(xiàn)區(qū)域級(jí)別故障的步驟,包括:利用所述預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD獲取其它非目標(biāo)數(shù)據(jù)中心對(duì)應(yīng)的區(qū)域信息,其中,所述區(qū)域信息至少包括:每個(gè)數(shù)據(jù)落盤進(jìn)程OSD的地址和心跳標(biāo)識(shí);利用所述預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD基于所述區(qū)域信息,依次訪問所述區(qū)域信息中每個(gè)數(shù)據(jù)落盤進(jìn)程OSD,得到訪問結(jié)果;若所述訪問結(jié)果指示網(wǎng)絡(luò)故障或者通訊超時(shí),則確定出現(xiàn)區(qū)域級(jí)別故障;
在確定出現(xiàn)區(qū)域級(jí)別故障時(shí),對(duì)出現(xiàn)區(qū)域級(jí)別故障的故障域進(jìn)行分區(qū)處理,得到多個(gè)網(wǎng)絡(luò)分區(qū);
獲取所述多個(gè)網(wǎng)絡(luò)分區(qū)中滿足預(yù)設(shè)篩選條件的目標(biāo)網(wǎng)絡(luò)分區(qū),并確定非目標(biāo)網(wǎng)絡(luò)分區(qū)為故障網(wǎng)絡(luò)分區(qū);
控制所述目標(biāo)網(wǎng)絡(luò)分區(qū)中每個(gè)數(shù)據(jù)落盤進(jìn)程OSD進(jìn)行切換,以使分布式存儲(chǔ)系統(tǒng)正常訪問業(yè)務(wù),并控制所述故障網(wǎng)絡(luò)分區(qū)中的數(shù)據(jù)落盤進(jìn)程OSD停止訪問業(yè)務(wù)。
2.根據(jù)權(quán)利要求1所述的故障處理方法,其特征在于,在利用所述目標(biāo)數(shù)據(jù)中心中的預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD檢測(cè)是否出現(xiàn)區(qū)域級(jí)別故障之后,所述故障處理方法還包括:
將出現(xiàn)區(qū)域級(jí)別故障的故障域信息上報(bào)至監(jiān)控服務(wù)中心MON,其中,監(jiān)控服務(wù)中心用于監(jiān)控分布式存儲(chǔ)系統(tǒng)中對(duì)應(yīng)的數(shù)據(jù)中心的狀態(tài);
利用監(jiān)控服務(wù)中心MON記錄故障域信息,并等待故障域信息收斂。
3.根據(jù)權(quán)利要求1所述的故障處理方法,其特征在于,對(duì)出現(xiàn)區(qū)域級(jí)別故障的故障域進(jìn)行分區(qū)處理,得到多個(gè)網(wǎng)絡(luò)分區(qū)的步驟,包括:
判斷在預(yù)設(shè)時(shí)間段內(nèi)是否接收到更新的故障域信息;
若在預(yù)設(shè)時(shí)間段內(nèi)未接收到更新的故障域信息,判斷兩個(gè)故障域是否互相上報(bào)故障;
若兩個(gè)故障域未互相上報(bào)故障,則確定兩個(gè)故障域?qū)儆谕粋€(gè)網(wǎng)絡(luò)分區(qū)。
4.根據(jù)權(quán)利要求1所述的故障處理方法,其特征在于,所述預(yù)設(shè)篩選條件包括:數(shù)據(jù)中心的主站點(diǎn)優(yōu)先級(jí)最高、數(shù)據(jù)中心處理業(yè)務(wù)速度最快。
5.一種分布式存儲(chǔ)系統(tǒng)的故障處理裝置,其特征在于,應(yīng)用于預(yù)設(shè)分布式存儲(chǔ)系統(tǒng),所述預(yù)設(shè)分布式存儲(chǔ)系統(tǒng)包括多個(gè)數(shù)據(jù)中心,每個(gè)所述數(shù)據(jù)中心包括多個(gè)數(shù)據(jù)落盤進(jìn)程OSD,所述故障處理裝置包括:
檢測(cè)單元,用于在確定目標(biāo)數(shù)據(jù)中心之間出現(xiàn)網(wǎng)絡(luò)故障時(shí),利用所述目標(biāo)數(shù)據(jù)中心中的預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD檢測(cè)是否出現(xiàn)區(qū)域級(jí)別故障,其中,所述檢測(cè)單元包括:第一獲取模塊,用于利用所述預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD獲取其它非目標(biāo)數(shù)據(jù)中心對(duì)應(yīng)的區(qū)域信息,其中,所述區(qū)域信息至少包括:每個(gè)數(shù)據(jù)落盤進(jìn)程OSD的地址和心跳標(biāo)識(shí);訪問模塊,用于利用所述預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD基于所述區(qū)域信息,依次訪問所述區(qū)域信息中每個(gè)數(shù)據(jù)落盤進(jìn)程OSD,得到訪問結(jié)果;第一確定模塊,用于在所述訪問結(jié)果指示網(wǎng)絡(luò)故障或者通訊超時(shí),則確定出現(xiàn)區(qū)域級(jí)別故障;
分區(qū)單元,用于在確定出現(xiàn)區(qū)域級(jí)別故障時(shí),對(duì)出現(xiàn)區(qū)域級(jí)別故障的故障域進(jìn)行分區(qū)處理,得到多個(gè)網(wǎng)絡(luò)分區(qū);
獲取單元,用于獲取所述多個(gè)網(wǎng)絡(luò)分區(qū)中滿足預(yù)設(shè)篩選條件的目標(biāo)網(wǎng)絡(luò)分區(qū),并確定非目標(biāo)網(wǎng)絡(luò)分區(qū)為故障網(wǎng)絡(luò)分區(qū);
控制單元,用于控制所述目標(biāo)網(wǎng)絡(luò)分區(qū)中每個(gè)數(shù)據(jù)落盤進(jìn)程OSD進(jìn)行切換,以使分布式存儲(chǔ)系統(tǒng)正常訪問業(yè)務(wù),并控制所述故障網(wǎng)絡(luò)分區(qū)中的數(shù)據(jù)落盤進(jìn)程OSD停止訪問業(yè)務(wù)。
6.根據(jù)權(quán)利要求5所述的故障處理裝置,其特征在于,還包括:
上報(bào)單元,用于在利用所述目標(biāo)數(shù)據(jù)中心中的預(yù)設(shè)數(shù)據(jù)落盤進(jìn)程OSD檢測(cè)是否出現(xiàn)區(qū)域級(jí)別故障之后,將出現(xiàn)區(qū)域級(jí)別故障的故障域信息上報(bào)至監(jiān)控服務(wù)中心MON,其中,監(jiān)控服務(wù)中心用于監(jiān)控分布式存儲(chǔ)系統(tǒng)中對(duì)應(yīng)的數(shù)據(jù)中心的狀態(tài);
記錄單元,用于利用監(jiān)控服務(wù)中心MON記錄故障域信息,并等待故障域信息收斂。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京星辰天合科技股份有限公司,未經(jīng)北京星辰天合科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010463289.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于處理到遠(yuǎn)程存儲(chǔ)位置的故障恢復(fù)的方法、系統(tǒng)以及程序
- 包括向外擴(kuò)展型存儲(chǔ)系統(tǒng)的存儲(chǔ)系統(tǒng)群及其管理方法
- 一種移動(dòng)存儲(chǔ)系統(tǒng)及其存儲(chǔ)方法
- 存儲(chǔ)系統(tǒng)的數(shù)據(jù)備份與恢復(fù)系統(tǒng)、方法、設(shè)備及存儲(chǔ)介質(zhì)
- 在線遷移異構(gòu)系統(tǒng)數(shù)據(jù)的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 建立存儲(chǔ)系統(tǒng)伙伴關(guān)系的方法及裝置
- 數(shù)據(jù)處理系統(tǒng)及其操作方法
- 一種容災(zāi)平臺(tái)及一種容災(zāi)方法
- 在基于云的存儲(chǔ)系統(tǒng)中服務(wù)I/O操作
- 一種數(shù)據(jù)修復(fù)方法及裝置
- 故障檢測(cè)裝置、故障檢測(cè)方法以及故障檢測(cè)程序
- 故障預(yù)測(cè)裝置、故障預(yù)測(cè)方法及故障預(yù)測(cè)程序
- 故障分析裝置、故障分析系統(tǒng)及故障分析方法
- 故障檢測(cè)方法、故障檢測(cè)裝置和故障檢測(cè)系統(tǒng)
- 故障檢測(cè)裝置、故障檢測(cè)方法及計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)
- 故障檢測(cè)裝置、故障檢測(cè)方法和計(jì)算機(jī)能讀取的存儲(chǔ)介質(zhì)
- 故障檢測(cè)裝置、故障檢測(cè)系統(tǒng)、故障檢測(cè)方法
- 故障處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 故障排除方法、故障排除裝置及故障排除系統(tǒng)
- 故障檢測(cè)電路、故障檢測(cè)系統(tǒng)及故障檢測(cè)方法





