[發明專利]用于虛擬計算環境中的故障管理的方法和系統有效
| 申請號: | 201080048606.2 | 申請日: | 2010-08-31 |
| 公開(公告)號: | CN102597962A | 公開(公告)日: | 2012-07-18 |
| 發明(設計)人: | D·R·弗蘭克林 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 付建軍 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 虛擬 計算 環境 中的 故障 管理 方法 系統 | ||
技術領域
本發明涉及故障管理的領域。特別地,本發明涉及虛擬計算環境中的故障管理。
背景技術
通常在虛擬環境中運行操作系統。這些操作系統進而被用于運行實現各種服務的應用。每個虛擬機(VM)直接復制一臺物理計算機,但在物理主機上的管理程序(hypervisor)之下運行。一個主機能夠容納多個VM。為了最大化主機利用率以及提高故障容許度,VM通常在一群(cluster)主機上運行。如果一個主機發生故障,則VM能夠移動(或者遷移)為在該群中的另一個主機上運行。
在VM上發生故障的方式與在物理機器上發生故障的方式類似。故障管理系統能夠被用于檢測和監視這些問題并且將它們報告給操作員,以實現快速解決。例如,是服務級管理系統,用于從包括故障事件的許多不同的網絡數據源收集企業范圍的事件信息(IBM、Tivoli和Netcool是IBM公司在全球許多司法管轄范圍內注冊的商標)。
在虛擬環境中,故障可能由運行VM的主管理程序系統上的故障引起。如果許多VM正由單個主機運行,則這能夠潛在導致報告不是由VM本身的故障導致的大批故障。對于操作員快速完成工作和修補,這可能令人迷惑并且耗時。另外,即使管理程序故障監視也被實現,這種(常常不太嚴重)的根由(root?cause)故障會在大批VM故障事件中被錯過并且被操作員忽視。
此外,解決VM上的某些故障的一種方法是將它們移至不同的物理主機。這將導致即時解決某些問題,但是在這些VM上運行的傳統故障監視系統更新這種狀態變化以及清除問題較慢。
因此,需要解決現有技術中的上述問題。
發明內容
根據本發明的第一方面,提供了一種用于虛擬計算環境中的故障管理的方法,包括:在虛擬計算環境中監視虛擬機和主機裝置的故障事件;在虛擬計算環境中監視狀況事件,其中狀況事件是指虛擬機名稱和主機裝置名稱;確定故障事件是否影響虛擬機和主機裝置二者;將涉及相同問題的關于虛擬機和主機裝置的故障事件進行相關。
該方法可以包括:保持虛擬機狀態表;以及保持虛擬機名稱和主機裝置名稱的映射。
該方法還可以包括將故障事件插入到故障事件表中。與問題相關的主機故障事件可以在故障事件表中被標記為根事件。與問題相關的虛擬機故障事件可以在故障事件表中被標記為癥狀,并且至根事件的鏈接被加入故障事件表中。
當虛擬機移至新主機時,該虛擬機的所有故障事件可以處于故障事件表中并且嚴重性被降低。此外,根鏈接可以被移除。
狀況事件可以由監視系統(探測器(probe)從其得到事件警報)進行監視并且包括虛擬機和主機裝置與主機故障事件之間的關系的指示。
可以通過在虛擬機上運行的探測器提供虛擬機中的故障事件并且可以通過在主機上運行的探測器提供主機中的故障事件。
可以由監視系統(探測器從其得到事件警報)監視主機中的故障事件。
根據本發明的第二方面,提供了一種用于虛擬計算環境中的故障管理的計算機軟件產品,該產品包括計算機可讀存儲介質,存儲其中存儲有包括計算機可執行指令的程序的計算機,這些指令當由計算機讀取執行時執行下面的步驟:在虛擬計算環境中監視虛擬機和主機裝置的故障事件;在虛擬計算環境中監視狀況事件,其中狀況事件是指虛擬機名稱和主機裝置名稱;確定故障事件是否影響虛擬機和主機裝置二者;將涉及相同問題的關于虛擬機和主機裝置的故障事件進行相關。
根據本發明的第三方面,提供了一種用于虛擬計算環境中的故障管理的系統,包括:處理器;在虛擬計算環境中虛擬機和主機裝置的故障事件的監視器;在虛擬計算環境中狀況事件的監視器,其中狀況事件是指虛擬機名稱和主機裝置名稱;規格化組件,用于確定故障事件是否影響虛擬機和主機裝置二者;以及相關組件,用于將涉及相同問題的關于虛擬機和主機裝置的故障事件進行相關。
該系統可以包括虛擬機狀態表以及虛擬機名稱與主機裝置名稱的映射。
該系統還可以包括故障事件表,用于保持關于虛擬機或者主機裝置的故障事件的列表。該系統可以包括針對與問題相關的主機故障事件的故障事件表中的根事件標記。該系統還可以包括針對與問題相關的虛擬機故障事件的故障事件表中的癥狀標記以及至故障事件表中的根事件的鏈接。
該系統可以包括故障解決組件,其中當虛擬機移至新主機時,解決組件將該虛擬機的所有故障事件安置在故障事件表中并且降低事件的嚴重性。
用于狀況事件的監視器可以從虛擬環境群控制中心獲得狀況事件并且可以將事件警報提供給故障管理系統。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080048606.2/2.html,轉載請聲明來源鉆瓜專利網。





