[發明專利]一種虛擬機集群的故障監控方法及裝置有效
| 申請號: | 201710401102.8 | 申請日: | 2017-05-31 |
| 公開(公告)號: | CN107171849B | 公開(公告)日: | 2020-03-31 |
| 發明(設計)人: | 耿東;張月輝 | 申請(專利權)人: | 鄭州云海信息技術有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/26 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 450018 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 虛擬機 集群 故障 監控 方法 裝置 | ||
本發明公開了一種虛擬機集群的故障監控方法及裝置,通過宿主機接收虛擬機集群心跳發生異常的通知指令;宿主機根據預記錄的節點信息,判斷本地節點的虛擬機是否為DC節點;當虛擬機為DC節點時,判斷虛擬機運行是否正常;當虛擬機運行正常時,宿主機將虛擬機作為DC節點,并向另一宿主機發送消息;當虛擬機運行異常時,宿主機獲取另一宿主機虛擬機的運行狀態,判斷另一宿主機虛擬機運行是否正常;當另一宿主機虛擬機運行正常時,將另一宿主機虛擬機作為DC節點。本申請通過宿主機監控虛擬機集群狀態,即利用宿主機自身資源對集群進行故障監控,不用借助外置工具,降低了成本,且不借助外部因素,使得監控自主可控。
技術領域
本發明涉及虛擬機領域,特別是涉及一種虛擬機集群的故障監控方法及裝置。
背景技術
對于虛擬機集群,當一個控制器節點故障時,該節點上的相關資源服務會切換到另一個節點,然后在對需要對故障節點進行恢復,故集群故障監控顯得尤為重要。
在建立集群的每個控制器中都可以存在一個虛擬機,這些虛擬機要建立集群,并監控集群。在兩個控制節點的情況下,如果虛擬機集群的心跳中斷,兩個節點孤立存在,法定節點數(quorum)就不起作用了,會造成這兩個節點爭搶資源,無法實現故障監控。
針對兩個控制節點的虛擬機集群,目前主要使用IP Quorum來實現監控,即通過外置IP連接集群的兩個節點,當集群心跳中斷時,哪個節點先與外置IP通信,拿到quorum,則將該節點作為DC節點繼續工作,另一個節點釋放資源。但是,這樣需要提供外置IP的服務器,來提供IP Quorum,增加成本,同時增加一條外部通信鏈路就多一分風險,使得監控不可控。
發明內容
本發明的目的是提供一種虛擬機集群的故障監控方法及裝置,目的在于解決現有技術中虛擬機集群監控方法的成本較高且不可控風險較高。
為解決上述技術問題,本發明提供一種虛擬機集群的故障監控方法,該方法包括:
宿主機接收虛擬機集群心跳發生異常的通知指令;
所述宿主機根據預記錄的節點信息,判斷本地節點的虛擬機是否為DC節點;
當所述虛擬機為所述DC節點時,判斷所述虛擬機運行是否正常;
當所述虛擬機運行正常時,所述宿主機將所述虛擬機作為所述DC節點,并向另一宿主機發送消息;
當所述虛擬機運行異常時,所述宿主機獲取另一宿主機虛擬機的運行狀態,判斷所述另一宿主機虛擬機運行是否正常;
當所述另一宿主機虛擬機運行正常時,將所述另一宿主機虛擬機作為所述DC節點。
可選地,在所述宿主機根據預記錄的節點信息,判斷本地節點的虛擬機是否為DC節點之后還包括:
當所述虛擬機為非DC節點時,所述宿主機獲取所述另一宿主機虛擬機的所述運行狀態,判斷所述另一宿主機虛擬機運行是否正常;
若正常,將所述另一宿主機虛擬機作為所述DC節點;
若異常,結束進程。
可選地,在所述宿主機接收虛擬機集群心跳發生異常的通知指令之前還包括:
在所述虛擬機轉為所述DC節點后,記錄所述虛擬機的信息,得出所述節點信息。
此外,本發明還提供了一種虛擬機集群的故障監控裝置,該裝置包括:
接收模塊,用于宿主機接收虛擬機集群心跳發生異常的通知指令;
第一判斷模塊,用于所述宿主機根據預記錄的節點信息,判斷本地節點的虛擬機是否為DC節點;
第二判斷模塊,用于當所述虛擬機為所述DC節點時,判斷所述虛擬機運行是否正常;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州云海信息技術有限公司,未經鄭州云海信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710401102.8/2.html,轉載請聲明來源鉆瓜專利網。





