[發明專利]一種節點健康管理方法、裝置和計算機可讀存儲介質有效
| 申請號: | 201910931729.3 | 申請日: | 2019-09-29 |
| 公開(公告)號: | CN110677480B | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 趙慧慧 | 申請(專利權)人: | 北京浪潮數據技術有限公司 |
| 主分類號: | H04L67/1097 | 分類號: | H04L67/1097;H04L67/1042 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 史翠 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 節點 健康 管理 方法 裝置 計算機 可讀 存儲 介質 | ||
本發明實施例公開了一種節點健康管理方法、裝置和計算機可讀存儲介質,對節點的日志文件中的特定參數進行量化處理,得到量化參數;為了實現對節點異常狀態的檢測,可以預先建立故障類型庫,在該故障類型庫中包括有各故障類型及其對應的參數范圍。將節點的各量化參數與預先建立的故障類型庫進行匹配,得到節點的狀態值。當所述狀態值大于或等于預設閾值時,則上報告警信息,并對節點上的數據進行備份之后將節點隔離。處于隔離狀態的節點不再提供存儲服務,降低了異常節點工作時對集群的數據存儲速率的影響,也降低了節點突然損壞或網絡突然斷開造成數據丟失的情況發生,保證了集群數據存儲正常進行,有效的提升了集群的整體服務性能。
技術領域
本發明涉及分布式存儲節點技術領域,特別是涉及一種節點健康管理方法、裝置和計算機可讀存儲介質。
背景技術
集群系統包括有多個節點,每個節點有其負責的工作,各節點之間可以進行交互。一旦某個節點出現異常,會對整個集群系統造成影響。
一般情況下,集群系統會在節點連接失敗的情況下,即節點狀態異常時,上報告警,方便操作人員對異常節點進行處理。但是除節點連接失敗情況,節點連接也會存在其他異常情況,比如節點響應較慢,或者節點相關服務存在異常時也會影響節點處理速度,進而影響整個集群的數據存儲速率,導致集群的整體服務性能下降。
可見,如何提升集群的整體服務性能,是本領域技術人員需要解決的問題。
發明內容
本發明實施例的目的是提供一種節點健康管理方法、裝置和計算機可讀存儲介質,可以提升集群的整體服務性能。
為解決上述技術問題,本發明實施例提供一種節點健康管理方法,包括:
對節點的日志文件中的特定參數進行量化處理,得到量化參數;
將各所述量化參數與預先建立的故障類型庫進行匹配,得到節點的狀態值;其中,所述故障類型庫中包括有各故障類型及其對應的參數范圍;
當所述狀態值大于或等于預設閾值時,則上報告警信息,并對所述節點上的數據進行備份之后將所述節點隔離。
可選地,所述將各所述量化參數與預先建立的故障類型庫進行匹配,得到節點的狀態值包括:
將各所述量化參數與各故障類型對應的參數范圍進行匹配,確定出所述節點在各故障類型下的匹配度;
選取取值最大的匹配度作為所述節點的狀態值。
可選地,在所述故障類型庫中還包括有各故障類型所對應的維修方法;
相應的,在所述選取取值最大的匹配度作為所述節點的狀態值之后還包括:
將取值最大的匹配度所對應的故障類型作為所述節點的節點故障類型,上報與所述節點故障類型相匹配的維修方法。
可選地,所述當所述狀態值大于或等于預設閾值時,對所述節點上的數據進行備份之后將所述節點隔離包括:
當所述狀態值大于或等于預設閾值時,將所述節點上的數據備份至預先設定的存儲空間;
對所述節點設置隔離標識,以切斷所述節點的存儲服務。
可選地,在將所述節點隔離之后還包括:
檢測所述節點的狀態值;
當所述節點的狀態值小于預設閾值時,則取消對所述節點設置的隔離標識,以恢復所述節點的存儲服務。
本發明實施例還提供了一種節點健康管理裝置,包括量化單元、匹配單元和隔離單元;
所述量化單元,用于對節點的日志文件中的特定參數進行量化處理,得到量化參數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京浪潮數據技術有限公司,未經北京浪潮數據技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910931729.3/2.html,轉載請聲明來源鉆瓜專利網。





