[發明專利]一種基于ETCD的集群容災管理系統在審
| 申請號: | 202010119902.2 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN111371599A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 趙建昌;趙山;王陽 | 申請(專利權)人: | 山東匯貿電子口岸有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/26;H04L29/08 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 馮春連 |
| 地址: | 250100 山東省濟南市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 etcd 集群 管理 系統 | ||
1.一種基于ETCD的集群容災管理系統,其特征在于,該系統基于ETCD分布式存儲特性,通過多節點監控方式,對集群中節點狀態進行投票,根據投票結果,確認集群中節點是否發生異常,并對異常狀態的節點進行切換,完成對集群中節點狀態的實時監控,同時,通過記錄節點狀態,保證集群中各個節點的穩定性。
2.根據權利要求1所述的一種基于ETCD的集群容災管理系統,其特征在于,所述系統通過同一套監控程序監控同一類型的集群,通過不同的監控程序監控不同類型的集群。
3.根據權利要求1所述的一種基于ETCD的集群容災管理系統,其特征在于,所述系統包括:
API接口模塊,用于接收用戶請求,所述用戶請求包括創建集群監控;
控制服務模塊,用于根據用戶請求對集群中節點進行監控實例管理、投票管理和故障轉移;
事件監聽模塊,用于根據用戶請求對集群中節點狀態進行實例監聽、投票監聽、故障轉移監聽;
ETCD分布式存儲模塊,用于實時保存事件監聽模塊的元數據信息,并根據事件監聽模塊確定異常節點,還便于用戶查看集群中各個節點的穩定性;
任務管理模塊,用于根據控制服務模塊、事件監聽模塊和ETCD分布式存儲模塊的傳送信息生成任務,生成的任務實時存儲于所述ETCD分布式存儲模塊;
定時任務線程池模塊,用于根據控制服務模塊的集群中節點狀態和任務管理模塊生成的任務進一步執行異步任務或定時任務,任務執行后實時存儲于所述ETCD分布式存儲模塊。
4.根據權利要求3所述的一種基于ETCD的集群容災管理系統,其特征在于,所述事件監聽模塊實時向ETCD分布式存儲模塊傳送監聽信息,所述ETCD分布式存儲模塊根據監聽信息確定異常節點并傳送至所述任務管理模塊,所述任務管理模塊生成節點切換任務或定時任務;
所述任務管理模塊執行節點切換任務,隨后,所述定時任務線程池模塊執行異步任務,或者,所述任務管理模塊接收并執行定時任務,隨后,所述定時任務線程池模塊執行同步任務;所述定時任務線程池模塊的任務執行結果存儲于所述ETCD分布式存儲模塊。
5.根據權利要求3所述的一種基于ETCD的集群容災管理系統,其特征在于,所述用戶請求包括創建集群監控,在用戶創建集群監控時,創建操作包括:
首先,用戶準備好需要監控的集群的健康檢查腳本及異常切換腳本;
隨后,用戶通過所述API接口模塊向所述控制服務模塊發送創建集群監控的請求,利用控制服務模塊確定用戶請求所包含節點的狀態,并將準備的腳本中需要的監控信息經所述事件監聽模塊后發送給ETCD分布式存儲模塊進行實時存儲。
6.根據權利要求5所述的一種基于ETCD的集群容災管理系統,其特征在于,所述用戶請求還包括刪除集群監控,在用戶刪除集群監控時,刪除操作包括:
首先,用戶通過所述API接口模塊向所述控制服務模塊發送刪除集群監控的請求,請求參數應當為創建集群監控時的監控實例ID;
隨后,根據用戶刪除集群監控的請求,刪除經所述事件監聽模塊存儲在所述ETCD分布式存儲模塊中與監控實例ID相同的元數據信息;
同時,用戶刪除控制服務模塊中與監控實例ID相同的集群監控。
7.根據權利要求5所述的一種基于ETCD的集群容災管理系統,其特征在于,所述用戶請求還包括更新集群監控,在用戶更新集群監控時,更新操作包括:
首先,用戶通過所述API接口模塊向所述控制服務模塊發送更新集群監控的請求,請求參數應當為需要更新的集群信息;
隨后,所述控制服務模塊暫停所要更新集群的監控任務;
同時,根據用戶更新集群監控的請求,更新經所述事件監聽模塊存儲在所述ETCD 分布式存儲模塊中集群的原始元數據信息;
最后,所述ETCD分布式存儲模塊的信息更新完畢后,所述控制服務模塊繼續對更新集群進行監控。
8.根據權利要求5-7中任一項所述的一種基于ETCD的集群容災管理系統,其特征在于,所述用戶請求還包括集群監控狀態,所述集群監控狀態包含狀態檢測和狀態修復;
A)所述集群監控的狀態檢測流程如下:
A1)用戶通過所述API接口模塊向所述控制服務模塊發送創建集群監控的請求,設定時間間隔,對集群按照時間間隔發送健康狀態檢測腳本,腳本返回結果:
A1-a)返回成功時,通過所述事件監聽模塊更新所述ETCD分布式存儲模塊存儲的元數據信息;
A1-b)返回失敗時,所述ETCD分布式存儲模塊根據所述事件監聽模塊的監聽信息確認投票結果,執行步驟A2);
A2)多個節點投票完成后,判斷所述ETCD分布式存儲模塊中投異常票的節點數是否過半,超過半數,則任務實例狀態異常,則進行集群狀態修復。
B)所述集群監控的狀態修復流程如下:
B1)根據所述ETCD分布式存儲模塊的投票結果確定需要修復的集群后,所述控制服務模塊暫停所要更新集群的監控任務;
B2)用戶在所述ETCD分布式存儲模塊預存有集群中所有節點的集群狀態修復腳本,用戶通過所述API接口模塊隨機選擇一個節點,利用所述ETCD分布式存儲模塊存儲的集群狀態修復腳本進行選中節點的狀態修復。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東匯貿電子口岸有限公司,未經山東匯貿電子口岸有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010119902.2/1.html,轉載請聲明來源鉆瓜專利網。





