[發明專利]一種高可用集群節點管理方法在審
| 申請號: | 201410821765.1 | 申請日: | 2015-08-03 |
| 公開(公告)號: | CN104506357A | 公開(公告)日: | 2015-07-29 |
| 發明(設計)人: | 胡文彬;艾建文;季統凱 | 申請(專利權)人: | 國云科技股份有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L1/22 |
| 代理公司: | 廣東莞信律師事務所 44332 | 代理人: | 余倫 |
| 地址: | 523808 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 可用 集群 節點 管理 方法 | ||
1.一種高可用集群節點管理方法,其特征在于:將集群節點區分為主節點、備份節點和普通節點三種,組成集群節點環形結構;每個節點都定時向后繼節點發送心跳消息,當后繼節點在指定的時間內沒有收到前驅節點發送的心跳消息時,則向主節點上報故障消息;主節點在收到故障消息后,向疑似故障節點發送檢測確認消息,確認疑似故障節點是否確實發生故障;最終以主節點檢測的結果為準;主節點在確認疑似故障節點發生故障后,發送消息告知相關節點,以便其更改監控與被監控節點;環中設置有備份節點,當主節點發生故障時,備份節點將接管主節點的工作,實現集群的高可用;
所述的方法實施的詳細流程是:
第一步,節點環初始化,每個物理節點安裝節點環管理系統,由管理人員指定主節點和備份節點,其他的節點默認為普通節點;
第二步,節點環內的每個物理節點定時向自己的后繼節點發送心跳消息,并把必要的備份信息同時發送;
第三步,當后繼節點在指定的時間內沒有收到前驅節點發送的心跳消息時,則會向主節點發送故障報告;
第四步,主節點收到故障報告后,會立即向疑似故障節點發送檢測確認消息;
第五步,如果疑似故障節點回應主節點的檢測確認消息,則表明該節點存活,主節點將不做任何處理;如果疑似故障節點沒回應主節點的檢測確認消息,則確認該節點發生故障;在向疑似故障節點發送檢測確認消息時,主節點會同時向疑似故障節點的前驅節點發送檢測消息,直到找到最靠近疑似故障節點的一個正常節點為止,這樣做的目的是為了防止多節點同時故障;
第六步,主節點更新節點環結構信息,把故障節點從節點環結構中刪除,并通知相關節點更新前驅和后繼節點信息;
所述的主節點作為唯一能夠修改節點環結構的角色,當有物理節點加入、退出或發生故障時,主節點修改節點環結構,并將節點環結構信息同步給備份節點,同時發送信息給必要的節點執行指定的操作,包括:告知某節點修改前驅或后繼節點;
由所述的備份節點隨時和主節點保持節點環結構信息同步,確保能在主節點發生故障時,及時接管主節點的工作;備份節點可有多個,離主節點越近,優先級越高,當主節點發生故障時,最高優先級且存活的備份節點自動升級為主節點,并負責更新節點環結構;
包括主節點、備份節點在內的所有節點都具備普通節點的功能;該功能包括主節點命令處理和心跳機制;
所述主節點命令處理具體包括:
(1)當節點環發生變化時,主節點發送命令通知普通節點更新前驅和后繼節點;
(2)當有備份節點故障時,主節點發送命令通知普通節點升級為備份節點,并與主節點同步信息;
(3)當節點的后繼節點上報該節點可能發生故障后,對該節點發送檢測確認消息,若節點返回應答消息,則表明自己存活;
所述節點的心跳機制為:
每一個普通節點同時是監控者和被監控者,在監控它的前驅節點的同時,需要向后繼節點發送心跳消息;作為監控者,當在指定時間內未收到前驅節點的心跳消息時,則向主節點報告前驅節點的故障信息;作為被監控者,普通節點要定時向后繼節點發送心跳消息,表明自己存活;心跳是節點環保持高可用的基礎;
備份節點接管主節點的工作后負責新環的構建和維護,同時自動指定新的備份節點,以保證環的可靠性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國云科技股份有限公司,未經國云科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410821765.1/1.html,轉載請聲明來源鉆瓜專利網。





