[發明專利]一種RAID盤組故障自動下線報修方法及系統在審
| 申請號: | 202011059284.3 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112162705A | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 白淑賢;李國平;李源;邱春武;白成剛 | 申請(專利權)人: | 新浪網技術(中國)有限公司 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06;G06F11/07 |
| 代理公司: | 北京卓嵐智財知識產權代理事務所(特殊普通合伙) 11624 | 代理人: | 郭智 |
| 地址: | 100193 北京市海淀區東北旺西路中關村*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 raid 故障 自動 下線 報修 方法 系統 | ||
本發明實施例提供一種RAID盤組故障自動下線報修方法及系統,其中,所述方法包括:循環遍歷服務器上的RAID盤組,獲取服務器上每一個RAID盤組的讀寫性能、狀態及壽命;根據RAID盤組的讀寫性能、狀態及壽命對每一個RAID盤組進行判定,并根據判定結果對RAID盤組進行剔除下線;將剔除下線的RAID盤組的日志信息寫入本地故障日志;根據記錄的本地故障日志向報修接口發送報修報警。根據本發明的技術方案,通過監測盤組的當前使用狀態、盤組的壽命及盤組的讀寫性能來自動判斷故障RAID盤組或者是疑似故障的RAID盤組,根據設定時間進行一次檢測,故障發現及時準確。
技術領域
本發明涉及計算機領域,具體涉及一種RAID盤組故障自動下線報修方法及系統。
背景技術
RAID盤組指的是磁盤陣列,簡單來說就是由N塊獨立的磁盤,組合成一個容量巨大的邏輯磁盤組。這個偌大的磁盤組主要作用就是存儲CDN服務所用的資源,支撐線上CDN服務能夠正常的運作。
RAID盤組故障是指磁盤硬件資源由于某種原因導致讀寫異常甚至不工作的情況。線上正在運行的服務器如果出現了故障盤組沒有處理,或者處理不及時,有可能會對服務造成影響,因此為了避免影響服務,要盡可能將故障盤組剔除下線。
現有故障RAID盤組下線及報修方法如下:
步驟一:異常場景1:監控RAID盤組狀態,如果有故障盤組,會發出報警到報警系統;異常場景2:監控業務指標,如果發現業務指標異常,會發出報警到報警系統;
步驟二:運維人員收到報警,判斷是否是RAID盤組狀態異常或者是RAID盤組讀寫異常造成業務指標波動;
步驟三:手動剔除故障RAID盤組;
步驟四:將故障RAID盤組的詳細信息收集好,提交報修申請。
在實現本發明的過程中,發現現有技術中存在以下缺點:
1、故障發現不夠及時:依靠人工收到的報警發現故障顯然很滯后。
2、故障定位不夠準確:監控RAID盤組的狀態并不能完全涵蓋盤組的異常情況。例如:盤組的狀態正常,但是盤組的年限接近過保,會造成盤組讀寫異常,此時需要人工花費大量的時間來定位問題。
3、剔除故障的RAID盤組不夠及時:前面兩點將導致故障的RAID盤組沒有在第一時間進行剔除,從而造成對CDN服務的影響。
4、故障RAID盤組報修不夠及時:故障的RAID盤組需要人工搜集相關的異常日志信息并提交報修申請,此步驟是人工處理,受不可控因素影響很有可能會遺忘,導致故障盤組沒有及時的報修,服務器上的盤組越來越少,間接性影響CDN服務。
發明內容
本發明實施例提供一種RAID盤組故障自動下線報修方法及裝置,結合多項指標來判斷RAID盤組是否故障;程序通過監測盤組的當前使用狀態、盤組的壽命及盤組的讀寫性能來自動判斷故障RAID盤組或者是疑似故障的RAID盤組,根據設定時間進行一次檢測,故障發現及時準確。
為達到上述目的,一方面,本發明實施例提供了一種RAID盤組故障自動下線報修方法,所述方法包括:
循環遍歷服務器上的RAID盤組,獲取服務器上每一個RAID盤組的讀寫性能、狀態
及壽命;
根據RAID盤組的讀寫性能、狀態及壽命對每一個RAID盤組進行判定,并根據判定
結果對RAID盤組進行剔除下線;
將剔除下線的RAID盤組的日志信息寫入本地故障日志;
根據記錄的本地故障日志向報修接口發送報修報警。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新浪網技術(中國)有限公司,未經新浪網技術(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011059284.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種汽車檔位傳感裝置
- 下一篇:一種汽車教學用實訓裝置





