[發明專利]一種故障處理方法及裝置在審
| 申請號: | 202110396996.2 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN115202803A | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 肖磊;李秀橋;孫宏偉;阮涵 | 申請(專利權)人: | 超聚變數字技術有限公司 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 楊澤;劉芳 |
| 地址: | 450046 河南省鄭州市鄭*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 故障 處理 方法 裝置 | ||
本申請提供一種故障處理方法及裝置,涉及集群的故障處理領域。該方法應用的VM集群包括管理節點、第一存儲節點和多個VM,該方法包括:管理節點從保存有每個VM的狀態的第一存儲節點中獲取多個VM的狀態,若該多個VM中至少一個VM為故障狀態,管理節點指示VM集群中的主機重新啟動至少一個故障VM,該主機包括承載故障VM的主機和VM集群中除承載故障VM的主機之外的其他主機。本方法將VM集群中的部分存儲空間作為統一的地址空間,并由包括該地址空間的第一存儲節點保存每個VM的狀態,管理節點從該第一存儲節點中獲取多個VM的狀態,避免了管理節點與VM集群中每個主機進行通信,減少了管理節點獲取VM的狀態的時間。
技術領域
本申請涉及集群的故障處理領域,尤其涉及一種故障處理方法及裝置。
背景技術
虛擬機(virtual machine,VM)指通過軟件模擬的具有完整硬件系統功能的、運行在一個完全隔離環境中的計算機系統。虛擬機集群是指一個包含管理節點和部署在不同主機上的多個虛擬計算機的系統,管理節點用于監控VM的運行狀態。
目前,主機可以監控運行的VM,管理節點需要與每個主機進行通信,從主機獲取VM的運行狀態。若VM故障,管理節點指示主機重新啟動故障VM。若主機發生故障,則主機無法正常運行VM,管理節點在其他的健康主機上重新啟動故障主機所承載的VM,以確保VM的正常運行,實現VM集群的高可用(high availability,HA)。由于管理節點需要與每個主機進行通信,導致VM集群的故障檢測時間較長,VM的恢復時間較長。因此,如何快速地檢測VM的故障是目前亟需解決的問題。
發明內容
本申請提供一種故障處理方法及裝置,解決了現有技術中VM的故障檢測速度較慢的問題。
為達到上述目的,本申請采用如下技術方案。
第一方面,本申請實施例提供一種故障處理方法,該方法應用于VM集群的管理節點,或者該方法可應用于可以支持實現該方法的通信設備,例如該通信設備包括芯片系統。在一種可能的設計中,該VM集群還包括第一存儲節點和多個VM,該方法包括:管理節點從保存有VM集群中每個VM的狀態的第一存儲節點中獲取多個VM的狀態,在該多個VM中至少一個VM的狀態為故障狀態的情況下,管理節點指示VM集群中的主機重新啟動至少一個故障VM,該VM集群中的主機包括承載故障VM的主機和VM集群中除承載故障VM的主機之外的其他主機。由于本申請實施例提供的故障處理方法將VM集群中的一部分存儲空間作為統一的地址空間,并由包括該地址空間的第一存儲節點保存VM集群中每個VM的狀態,管理節點可以從第一存儲節點的地址空間中獲取多個VM的狀態,避免了管理節點與VM集群中每個主機進行通信,減少了管理節點獲取VM集群中所有VM的狀態的時間,提高了VM集群的故障恢復效率。
在一種可選的實現方式中,管理節點從第一存儲節點獲取多個VM的狀態,包括:管理節點向第一存儲節點發送第一請求,該第一請求用于指示第一存儲節點上報多個VM的狀態;管理節點接收第一存儲節點發送的多個VM的狀態。相較于現有技術中管理節點需要與每個主機進行通信,才能獲取到VM集群中所有VM的狀態,本申請實施例所提供的故障處理方法,管理節點僅需與第一存儲節點進行通信,減少了管理節點進行故障檢測所需的通信次數,降低了網絡通信所需的時間,提高了VM集群的故障檢測效率。
在另一種可選的實現方式中,管理節點從第一存儲節點獲取多個VM的狀態,包括:管理節點接收第一存儲節點周期性地發送的多個VM的狀態。管理節點可以從第一存儲節點周期性獲取到VM集群中每個VM的狀態,減少了管理節點與主機的通信次數以及VM集群的故障檢測時間。
在另一種可選的實現方式中,第一存儲節點還用于保存VM集群中每個主機的硬件設備地址,該方法還包括:管理節點從第一存儲節點獲取承載故障VM的主機的硬件設備地址;若承載故障VM的主機故障,管理節點依據硬件設備地址確定VM集群中除承載故障VM的主機之外的其他主機。該硬件設備地址可以包括故障主機在第一存儲節點中的標識,故障主機的地址以及故障主機的設備在故障主機中的地址。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于超聚變數字技術有限公司,未經超聚變數字技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110396996.2/2.html,轉載請聲明來源鉆瓜專利網。





