[發明專利]一種集群網卡監控方法及裝置有效
| 申請號: | 201910848295.0 | 申請日: | 2019-09-09 |
| 公開(公告)號: | CN110611603B | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 史宗華 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L12/24;H04L29/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 郭化雨 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 集群 網卡 監控 方法 裝置 | ||
本發明公開了一種集群網卡監控方法及裝置,所述方法包括:查詢全部集群網卡IP地址,并創建對應的周期檢測任務;在一個檢測周期內,查詢并儲存所述集群網卡當前工作狀態;比較所述本周期工作狀態和上一周期存儲的工作狀態;當二者不同時,上報分布式存儲系統。通過解析IP網段將集群網卡添加至周期檢測任務并定期檢測集群網卡的工作狀態。當某個集群網卡出現故障時,將故障狀態同步至全部節點進行存儲并上報分布式存儲系統。由于所述周期檢測任務的檢測周期很短,遠小于分布式存儲系統的心跳周期,因此可以及時檢測分布式存儲系統中集群網卡的故障狀態,并快速進行恢復,大大降低了集群網卡故障對業戶業務的影響,提升了分布式存儲系統的可靠性。
技術領域
本發明涉及分布式存儲系統領域,尤其涉及一種集群網卡監控方法及裝置。
背景技術
隨著大數據技術的發展,元數據的體量也越來越大。對于大數據而言,元數據的存取性能是整個分布式文件系統性能的關鍵。目前,常見的元數據存儲系統可以分為集中式和分布式元存儲系統兩類。集中式元數據管理架構采用單一的元數據服務器,實現簡單。但是存在單點故障等問題。分布式存儲系統則將元數據分散在多個節點上。進而解決了元數據服務器的性能瓶頸等問題,并提高了元數據管理架構的可擴展性。
在分布式存儲系統中,不但服務器集群和外部網絡需要進行通信,多個服務器節點之間也需要進行通信。因此,分布式存儲系統中一般會有兩種網卡:集群網卡和業務網卡。其中集群網卡用于分布式存儲系統中各個存儲服務器之間的通信,業務網卡用于服務器集群與外部客戶進行通信。在現有技術中,分布式存儲系統可以定期對業務網卡進行掃描,當業務網卡出現故障時及時對其進行修復。
但是當集群網卡出現故障時,當前分布式存儲系統無法及時發現故障,只能依靠分布式存儲系統每個心跳周期內的故障檢測機制發現故障。而所述心跳周期時間較長,無法實現集群網卡故障的及時發現及上報。因此,當分布式存儲系統中集群網卡出現故障時,極易影響客戶的存儲業務,大幅度降低了分布式存儲系統的可靠性。
發明內容
有鑒于此,有鑒于此,本發明主要目的在于提供一種分布式存儲系統中集群網卡監控方法及裝置,實現對集群網卡的實時檢測及故障上報,以到達提升分布式存儲系統的穩定性的目的。
為了實現上述目的,本發明提供了以下技術方案:
一種集群網卡監控方法,查詢集群網卡IP地址并將IP地址對應的集群網卡加入周期檢測任務,該方法包括:
基于所述周期檢測任務,在一個檢測周期內,根據所述IP地址訪問所述集群網卡并獲取所述集群網卡當前工作狀態;
比較所述本周期工作狀態和上一周期工作狀態;當檢測到工作狀態變為故障狀態時,上報分布式存儲系統并儲存所述工作狀態。
可選地,所述查詢集群網卡地址并創建周期監測任務包括:
從存儲集群配置文件中解析集群使用的IP網段;
根據所述IP網段在存儲節點中查找對應的存儲集群IP地址;
將所述IP地址對應的集群網卡加入分布式存儲系統的周期檢測任務中,并設置檢測周期。
可選地,所述查詢并存儲集群網卡當前工作狀態在分布式存儲系統各個節點中進行。
可選地,所述比較集群網卡工作狀態并上報故障包括:
節點檢測到所述集群網卡當前工作狀態為故障時,將所述節點內存儲的所述集群網卡當前工作狀態設為故障狀態并通知主節點;
所述主節點將本周期集群網卡當前工作狀態與上一周期儲存的工作狀態進行比較;
當檢測到所述集群網卡當前工作狀態從正常狀態變為故障狀態時,所述主節點通知分布式存儲系統所述集群網卡出現故障。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910848295.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種二層點對點通道狀態監測方法及系統
- 下一篇:局域網設備評估處理方法及裝置





