[發明專利]一種云存儲集群節點服務狀態實時監控方法和系統在審
| 申請號: | 201510047586.1 | 申請日: | 2015-01-29 |
| 公開(公告)號: | CN104683446A | 公開(公告)日: | 2015-06-03 |
| 發明(設計)人: | 高俊萍 | 申請(專利權)人: | 廣州杰賽科技股份有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08 |
| 代理公司: | 廣州三環專利代理有限公司 44202 | 代理人: | 麥小嬋;郝傳鑫 |
| 地址: | 510310 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 存儲 集群 節點 服務 狀態 實時 監控 方法 系統 | ||
技術領域
本發明涉及云存儲技術領域,尤其涉及一種云存儲集群節點服務狀態實時監控方法和系統。
背景技術
現有的云存儲產品大多采用Ceph技術,Ceph是一個PB級分布式文件系統,通過相應接口支持對象存儲(Object?Storage),塊存儲(Block?Storage)和文件存儲(File?Storage)三種存儲服務。既是統一存儲系統也是分布式存儲系統,具有高擴展,高可靠,高性能的特點。由于其開源性,目前Ceph已作為統一存儲的解決方案,被廣泛應用于私有云、公有云和生產環境中。
在實際應用當中,Ceph存儲集群內除了安裝Ceph提供的相應存儲服務外,常常還會部署安裝許多其他服務,如HTTP(Hypertext?transfer?protocol,超文本傳送協議)和數據庫服務,所有的服務組成一個完整的云存儲產品。因而,集群節點內服務的可用性直接決定了整個云存儲產品的可用性,故實現對集群節點內所有相關服務的運行狀態及可用性的實時監控是云存儲產品必不可少的一項重要功能。
現有的監控方法一般為針對特定服務制定相應的監控策略,通過服務器端輪詢查看所有服務運行狀態(即服務進程是否運行),然而,現有的監控方法并未對相關服務的可用性進行監控。大量的實踐證明,即使服務進程正在運行不一定就能保證該服務可用,以存儲服務為例,存儲服務的進程還在運行,卻可能會出現無法寫入數據的情況。同時,在采用單一監視器情況下,單一監視器的損壞將導致整個系統監控功能的失效,為了防止上述單點故障的發生,現有的監控方法采用多監視器并行運行的策略,一般預先選出三個以上的監視器,其中一個作為主監視器,其他監視器作為從監視器。當主監視器發生故障時,使用從監視器替代主監視器;然而該方案在正常工作時,從監視器處于閑置狀態,造成系統資源的浪費。
發明內容
本發明的目的在于提供一種云存儲集群節點服務狀態實時監控方法和系統,在對服務運行狀態進行監控的同時,對集群節點的服務可用性進行監控,提高云存儲產品的整體監控性能。
一方面,本發明實施例提供了一種云存儲集群節點服務狀態實時監控方法,每個集群節點均部署有服務狀態采集器;所述方法包括:
所述服務狀態采集器采集所在集群節點內的服務狀態信息,并將所述服務狀態信息處理成統一格式后,上報給服務監控處理器;所述服務狀態信息包括服務運行狀態信息和服務可用性狀態信息;
所述服務監控處理器收集所有服務狀態采集器上報的服務狀態信息,對所述服務狀態信息進行數據封裝,形成監控信息,并通過相應的API接口將所述監控信息對外發布。
優選地,所述方法還包括:
若所述服務監控處理器成功接收所述服務狀態信息,則所述服務監控處理器向所述服務狀態采集器返回確認信息;
若所述服務狀態采集器未收到所述服務監控處理器返回的確認信息,則向集群內其他服務狀態采集器發出上報失敗的廣播信息;并且,當發出所述廣播信息的服務狀態采集器的數量超過指定值時,則判定當前服務監控處理器出現故障。
優選地,所述方法還包括:
若當前服務監控處理器發生故障時,利用Paxos算法,在所有集群節點中決策產生新的服務監控處理器,以替換發生故障的當前服務監控處理器。
優選地,所述替換發生故障的當前服務監控處理器具體包括:
將所述新的服務監控處理器的地址信息發送給所述服務狀態采集器;
所述服務狀態采集器根據所述地址信息,將采集到的所述服務狀態信息上報給所述新的服務監控處理器。
優選地,所述方法還包括:
通過故障處理單元對發生故障的服務監控處理器進行修復或故障告警。
優選地,所述方法還包括:
所述服務監控處理器通過所述API接口,將所述監控信息發送至上層云存儲管理子系統,以對所述監控信息進行實時動態展示。
另一方面,本發明實施例提供了一種云存儲集群節點服務狀態實時監控系統,包括底層云存儲服務子系統;
所述底層云存儲服務子系統包括服務監控處理器、集群節點;
每個集群節點均部署有服務狀態采集器;
所述服務狀態采集器,用于采集所在集群節點內的服務狀態信息,并將所述服務狀態信息處理成統一格式后,上報給服務監控處理器;所述服務狀態信息包括服務運行信息和服務可用性信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州杰賽科技股份有限公司;,未經廣州杰賽科技股份有限公司;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510047586.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:環境監測報警系統及其應用方法
- 下一篇:通信設備、通信系統和通信方法





