[發(fā)明專利]一種基于ICFS系統(tǒng)的OSD故障定位方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201810325885.0 | 申請(qǐng)日: | 2018-04-12 |
| 公開(公告)號(hào): | CN108519927A | 公開(公告)日: | 2018-09-11 |
| 發(fā)明(設(shè)計(jì))人: | 徐曉陽 | 申請(qǐng)(專利權(quán))人: | 鄭州云海信息技術(shù)有限公司 |
| 主分類號(hào): | G06F11/07 | 分類號(hào): | G06F11/07 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 450018 河南省鄭州市*** | 國(guó)省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 故障判定 定位方法及系統(tǒng) 分類 判定 故障處理效率 發(fā)生故障 故障定位 故障提供 數(shù)據(jù)冗余 預(yù)先設(shè)置 集群 申請(qǐng) | ||
本發(fā)明公開了一種基于ICFS系統(tǒng)的OSD故障定位方法及系統(tǒng),包括預(yù)先對(duì)ICFS系統(tǒng)中的OSD的故障進(jìn)行分類及對(duì)故障對(duì)應(yīng)的故障判定方式進(jìn)行分類;獲取ICFS系統(tǒng)的故障判定信息,故障判定信息包括ICFS系統(tǒng)中各個(gè)OSD的OSD信息和/或ICFS系統(tǒng)的數(shù)據(jù)冗余規(guī)則;根據(jù)故障判定信息并結(jié)合預(yù)先設(shè)置好的故障判定方式及故障的分類判定是否存在OSD發(fā)生故障。可見,本申請(qǐng)預(yù)先對(duì)OSD的故障和故障判定方式進(jìn)行分類,并作為后續(xù)OSD故障定位的判定依據(jù),以便后續(xù)結(jié)合ICFS系統(tǒng)的故障判定信息來判定OSD是否存在故障,為可能發(fā)生的故障提供了定位方向,縮短了故障定位時(shí)間,提高了故障處理效率,提高了集群的性能。
技術(shù)領(lǐng)域
本發(fā)明涉及分布式系統(tǒng)技術(shù)領(lǐng)域,特別是涉及一種基于ICFS系統(tǒng)的OSD故障定位方法及系統(tǒng)。
背景技術(shù)
目前對(duì)于海量存儲(chǔ)產(chǎn)品,用戶可以自行定義數(shù)據(jù)的冗余規(guī)則(例如副本或者糾刪),并通過CRUSH算法指定數(shù)據(jù)的物理存儲(chǔ)位置,完成故障域的分離。但是在存儲(chǔ)系統(tǒng)例如ICFS(Inspur Cluster File System,分布式文件系統(tǒng))系統(tǒng)中,一個(gè)存儲(chǔ)節(jié)點(diǎn)支持12到54個(gè)磁盤不等,使得其OSD的故障率也大大高于其他系統(tǒng)。根據(jù)ICFS系統(tǒng)提供的數(shù)據(jù)冗余規(guī)則,允許存儲(chǔ)節(jié)點(diǎn)出現(xiàn)磁盤故障,但必須保證集群可以正常使用且數(shù)據(jù)不丟失,但是目前ICFS系統(tǒng)中OSD故障處理都需要開發(fā)人員進(jìn)行現(xiàn)場(chǎng)定位,定位時(shí)間長(zhǎng),降低了集群的性能。
因此,如何提供一種解決上述技術(shù)問題的方案是本領(lǐng)域技術(shù)人員目前需要解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于ICFS系統(tǒng)的OSD故障定位方法及系統(tǒng),為可能發(fā)生的故障提供了定位方向,縮短了故障定位時(shí)間,提高了故障處理效率,提高了集群的性能。
為解決上述技術(shù)問題,本發(fā)明提供了一種基于ICFS系統(tǒng)的OSD故障定位方法,包括:
預(yù)先對(duì)ICFS系統(tǒng)中的OSD的故障進(jìn)行分類及對(duì)所述故障對(duì)應(yīng)的故障判定方式進(jìn)行分類;
獲取所述ICFS系統(tǒng)的故障判定信息,所述故障判定信息包括所述ICFS系統(tǒng)中各個(gè)OSD的OSD信息和/或所述ICFS系統(tǒng)的數(shù)據(jù)冗余規(guī)則;
根據(jù)所述故障判定信息并結(jié)合預(yù)先設(shè)置好的故障判定方式及故障的分類判定是否存在OSD發(fā)生故障。
優(yōu)選地,所述OSD的故障分類包括OSD Down和/或OSD的容量達(dá)到極限范圍和/或OSD震蕩和/或OSD慢盤。
優(yōu)選地,當(dāng)所述OSD的故障分類包括OSD Down時(shí),所述OSD Down包括故障域內(nèi)的部分OSD Down、不同故障域內(nèi)的共同持有一些對(duì)象的數(shù)據(jù)的OSD同時(shí)down和OSD Down掉且不在osd tree中。
優(yōu)選地,所述OSD Down對(duì)應(yīng)的故障判定方式為:
輸入icfs-s指令后,所述ICFS系統(tǒng)中的各個(gè)OSD的OSD信息中,存在OSD的狀態(tài)信息為down;
所述OSD的容量達(dá)到極限范圍對(duì)應(yīng)的故障判定方式為:
輸入icfs-s指令后,存在near full告警信息;
所述OSD震蕩對(duì)應(yīng)的故障判定方式為:
所述ICFS系統(tǒng)中,存在OSD的狀態(tài)在第一預(yù)設(shè)時(shí)間內(nèi)多次交替出現(xiàn)up和down;
所述OSD慢盤對(duì)應(yīng)的故障判定方式為:
所述ICFS系統(tǒng)的狀態(tài)出現(xiàn)blocked。
優(yōu)選地,該方法還包括:
預(yù)先針對(duì)所述OSD的不同類別的故障制定故障解決策略;
在判定所述ICFS系統(tǒng)存在故障后,該方法還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭州云海信息技術(shù)有限公司,未經(jīng)鄭州云海信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810325885.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過軟件的測(cè)試或調(diào)試防止錯(cuò)誤





