[發(fā)明專(zhuān)利]集群故障恢復(fù)時(shí)長(zhǎng)估算方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201811193572.0 | 申請(qǐng)日: | 2018-10-12 |
| 公開(kāi)(公告)號(hào): | CN109284220B | 公開(kāi)(公告)日: | 2022-06-21 |
| 發(fā)明(設(shè)計(jì))人: | 張立新;文靜;張曉偉 | 申請(qǐng)(專(zhuān)利權(quán))人: | 深信服科技股份有限公司 |
| 主分類(lèi)號(hào): | G06F11/34 | 分類(lèi)號(hào): | G06F11/34 |
| 代理公司: | 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 胡海國(guó) |
| 地址: | 518000 廣東省深圳市南*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 集群 故障 恢復(fù) 估算 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種集群故障恢復(fù)時(shí)長(zhǎng)估算方法,其特征在于,所述集群故障恢復(fù)時(shí)長(zhǎng)估算方法包括以下步驟:
分別獲取分布式存儲(chǔ)集群發(fā)生故障前后的集群信息;
基于所述集群信息,分別采用Crush算法構(gòu)建集群發(fā)生故障前后對(duì)應(yīng)的對(duì)象存儲(chǔ)設(shè)備OSD與歸置組PG的拓?fù)浣Y(jié)構(gòu);
將集群發(fā)生故障前后對(duì)應(yīng)的OSD與PG的拓?fù)浣Y(jié)構(gòu)進(jìn)行比對(duì),確定發(fā)生數(shù)據(jù)遷移的OSD與PG;
基于發(fā)生數(shù)據(jù)遷移的OSD與PG,估算集群故障恢復(fù)時(shí)長(zhǎng);
所述基于發(fā)生數(shù)據(jù)遷移的OSD與PG,估算集群故障恢復(fù)時(shí)長(zhǎng)包括:
基于發(fā)生數(shù)據(jù)遷移的OSD與PG,計(jì)算集群中平均每個(gè)OSD發(fā)生遷移的數(shù)據(jù)量;
計(jì)算遷移所述數(shù)據(jù)量的時(shí)間,以估算集群故障恢復(fù)時(shí)長(zhǎng)。
2.如權(quán)利要求1所述的集群故障恢復(fù)時(shí)長(zhǎng)估算方法,其特征在于,所述集群信息包括:集群的故障域級(jí)別、OSD信息以及PG信息,其中,集群的故障域級(jí)別包括主機(jī)級(jí)別、OSD級(jí)別,所述OSD信息包括OSD標(biāo)識(shí),PG信息包括PG標(biāo)識(shí)。
3.如權(quán)利要求2所述的集群故障恢復(fù)時(shí)長(zhǎng)估算方法,其特征在于,所述集群信息還包括:集群當(dāng)前的總數(shù)據(jù)量;所述基于發(fā)生數(shù)據(jù)遷移的OSD與PG,計(jì)算集群中平均每個(gè)OSD發(fā)生遷移的數(shù)據(jù)量包括:
基于發(fā)生數(shù)據(jù)遷移的OSD與PG,確定發(fā)生數(shù)據(jù)遷移的OSD數(shù)以及每個(gè)發(fā)生數(shù)據(jù)遷移的OSD對(duì)應(yīng)的PG數(shù);
根據(jù)發(fā)生數(shù)據(jù)遷移的OSD數(shù)以及每個(gè)發(fā)生數(shù)據(jù)遷移的OSD對(duì)應(yīng)的PG數(shù),計(jì)算發(fā)生數(shù)據(jù)遷移的OSD中平均每個(gè)OSD發(fā)生數(shù)據(jù)遷移的PG數(shù),以及根據(jù)集群當(dāng)前的總數(shù)據(jù)量計(jì)算平均每個(gè)PG所管理的數(shù)據(jù)量;
根據(jù)平均每個(gè)OSD發(fā)生數(shù)據(jù)遷移的PG數(shù)、平均每個(gè)PG所管理的數(shù)據(jù)量,計(jì)算集群中平均每個(gè)OSD發(fā)生遷移的數(shù)據(jù)量。
4.如權(quán)利要求3所述的集群故障恢復(fù)時(shí)長(zhǎng)估算方法,其特征在于,在所述計(jì)算遷移所述數(shù)據(jù)量的時(shí)間,以估算集群故障恢復(fù)時(shí)長(zhǎng)的步驟之前,所述集群故障恢復(fù)時(shí)長(zhǎng)估算方法還包括:
對(duì)集群中OSD所在磁盤(pán)的讀寫(xiě)性能進(jìn)行抽樣得到抽樣數(shù)據(jù);
計(jì)算各抽樣數(shù)據(jù)的算術(shù)平均數(shù),并將計(jì)算結(jié)果作為集群中OSD的平均讀寫(xiě)性能;
所述計(jì)算遷移所述數(shù)據(jù)量的時(shí)間,以估算集群故障恢復(fù)時(shí)長(zhǎng)包括:
根據(jù)集群中平均每個(gè)OSD發(fā)生遷移的數(shù)據(jù)量、集群中OSD的平均讀寫(xiě)性能,計(jì)算遷移所述數(shù)據(jù)量的時(shí)間,以估算集群故障恢復(fù)時(shí)長(zhǎng)。
5.如權(quán)利要求1所述的集群故障恢復(fù)時(shí)長(zhǎng)估算方法,其特征在于,在所述計(jì)算遷移所述數(shù)據(jù)量的時(shí)間,以估算集群故障恢復(fù)時(shí)長(zhǎng)的步驟之后,所述集群故障恢復(fù)時(shí)長(zhǎng)估算方法還包括:
基于估算的集群故障恢復(fù)時(shí)長(zhǎng)進(jìn)行告警,以告知集群發(fā)生故障后的預(yù)計(jì)恢復(fù)時(shí)間。
6.一種集群故障恢復(fù)時(shí)長(zhǎng)估算裝置,其特征在于,所述集群故障恢復(fù)時(shí)長(zhǎng)估算裝置包括:
信息獲取模塊,用于分別獲取分布式存儲(chǔ)集群發(fā)生故障前后的集群信息;
Crush算法模塊,用于基于所述集群信息,分別采用Crush算法構(gòu)建集群發(fā)生故障前后對(duì)應(yīng)的對(duì)象存儲(chǔ)設(shè)備OSD與歸置組PG的拓?fù)浣Y(jié)構(gòu);
結(jié)構(gòu)比對(duì)模塊,用于將集群發(fā)生故障前后對(duì)應(yīng)的OSD與PG的拓?fù)浣Y(jié)構(gòu)進(jìn)行比對(duì),確定發(fā)生數(shù)據(jù)遷移的OSD與PG;
時(shí)長(zhǎng)估算模塊,用于基于發(fā)生數(shù)據(jù)遷移的OSD與PG,估算集群故障恢復(fù)時(shí)長(zhǎng);
所述時(shí)長(zhǎng)估算模塊包括:
數(shù)據(jù)量計(jì)算單元,用于基于發(fā)生數(shù)據(jù)遷移的OSD與PG,計(jì)算集群中平均每個(gè)OSD發(fā)生遷移的數(shù)據(jù)量;
時(shí)長(zhǎng)估算單元,用于計(jì)算遷移所述數(shù)據(jù)量的時(shí)間,以估算集群故障恢復(fù)時(shí)長(zhǎng)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于深信服科技股份有限公司,未經(jīng)深信服科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811193572.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種操作記錄方法和裝置
- 下一篇:一種預(yù)警系統(tǒng)及方法
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時(shí)維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺(tái)多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點(diǎn)和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)介質(zhì)
- 混合云場(chǎng)景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 故障檢測(cè)裝置、故障檢測(cè)方法以及故障檢測(cè)程序
- 故障預(yù)測(cè)裝置、故障預(yù)測(cè)方法及故障預(yù)測(cè)程序
- 故障分析裝置、故障分析系統(tǒng)及故障分析方法
- 故障檢測(cè)方法、故障檢測(cè)裝置和故障檢測(cè)系統(tǒng)
- 故障檢測(cè)裝置、故障檢測(cè)方法及計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)
- 故障檢測(cè)裝置、故障檢測(cè)方法和計(jì)算機(jī)能讀取的存儲(chǔ)介質(zhì)
- 故障檢測(cè)裝置、故障檢測(cè)系統(tǒng)、故障檢測(cè)方法
- 故障處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 故障排除方法、故障排除裝置及故障排除系統(tǒng)
- 故障檢測(cè)電路、故障檢測(cè)系統(tǒng)及故障檢測(cè)方法
- 迭代信道估算以及基于信道估算的補(bǔ)償
- 接收電平測(cè)定系統(tǒng)
- 基于計(jì)算機(jī)軟件系統(tǒng)實(shí)現(xiàn)軟件項(xiàng)目成本估算的方法及系統(tǒng)
- 數(shù)據(jù)估算方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種項(xiàng)目計(jì)劃生成方法、裝置及存儲(chǔ)設(shè)備、程序產(chǎn)品
- 虛擬現(xiàn)實(shí)系統(tǒng)中的用戶(hù)身高確定方法及裝置、存儲(chǔ)介質(zhì)
- 一種農(nóng)業(yè)糧食產(chǎn)量估算方法和系統(tǒng)
- 一種電池荷電狀態(tài)SOC估算方法和裝置
- 一種基于多叉樹(shù)的公式模型求解編輯器
- 基于時(shí)間預(yù)估模型的AGV調(diào)度方法





