[發明專利]云主機異常故障檢測恢復系統、方法及云平臺有效
| 申請號: | 201811422877.4 | 申請日: | 2018-11-27 |
| 公開(公告)號: | CN109522095B | 公開(公告)日: | 2020-04-10 |
| 發明(設計)人: | 許廣彬;張建峰;譚瑞忠 | 申請(專利權)人: | 無錫華云數據技術服務有限公司 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455;G06F11/30 |
| 代理公司: | 蘇州友佳知識產權代理事務所(普通合伙) 32351 | 代理人: | 儲振 |
| 地址: | 214000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 主機 異常 故障 檢測 恢復 系統 方法 平臺 | ||
本發明公開了云主機異常故障檢測恢復系統,包括采集組件,整理組件、內置動作庫的數據庫、學習組件、交互組件、執行組件及監控組件;采集組件采集狀態數據,使用整理組件進行歸類標記以形成故障檢測用例集與正常用例集;學習組件提取故障檢測用例集,訓練得到最佳故障檢測模型并發送至數據庫;交互組件調用執行組件以執行動作庫中的動作,通知并使用整理組件進行歸類標記以形成故障恢復用例集;監控組件自數據庫獲取最佳故障檢測模型,并與整理組件實時采集的狀態數據進行對比,在對比成功后,調用故障檢測用例集中的實例,以對云主機進行故障標定。本發明所揭示的云主機異常故障檢測恢復系統實現了云主機故障的準確判斷及故障恢復。
技術領域
本發明涉及云計算技術領域,尤其涉及一種云主機異常故障檢測恢復系統以及基于該云主機異常故障檢測恢復系統的一種云主機異常故障檢測恢復方法,以及一種云平臺。
背景技術
在基于IaaS平臺的云主機場景中,當云主機(其本質上是一種虛擬機)處于超載或者資源緊張時會被物理機的安全機制強制關閉,從而影響到云主機向用戶提供正常的響應及服務。通常的,如果云主機被強制關閉所導致的云主機內部操作系統的藍屏現象及宕機現象是無法被用戶所感知的。既使管理員遠程登錄后臺并發現某個或者某些云主機出現故障時,則實際上出現故障的云主機向用戶提供響應及服務的狀態已經持續了相當長的一段時間了。
為了監控云主機的狀態,通常的解決方案是定時地向云主機的內部注入監控程序,以確定云主機是否存活;并在發現云主機不可訪問時判定其為故障云主機,并執行重啟操作。但是該現有技術只能檢測出云主機不可訪問,無法判斷這種不可訪問是因為“超載或者資源緊張”還是因為基于用戶的關機行為所導致的。因此如果采用現有技術手段,會導致對云主機執行重啟操作的盲目性,并增加了誤判幾率。
有鑒于此,有必要對現有技術中的云主機發生故障時的檢測恢復系統予以改進,以解決上述問題。
發明內容
本發明的目的在公開一種云主機異常故障檢測系統、方法及云平臺,以實現不僅僅能夠檢測到云主機是否發生故障,并判斷出該故障是否為基于用戶操作意愿所呈現的故障,有效防止對云主機所采取不必要或者錯誤的干預,提高用戶體驗;同時,實現云主機能夠提供更高可用的業務服務支持,盡量減小云主機的操作系統和物理資源脫節對客戶業務連續性的影響。
為實現上述第一個發明目的,本發明公開了一種云主機異常故障檢測恢復系統,包括:采集組件,整理組件、內置動作庫的數據庫、學習組件、交互組件、執行組件及監控組件;
采集組件采集狀態數據,使用整理組件進行歸類標記以形成故障檢測用例集與正常用例集;
學習組件提取故障檢測用例集,訓練得到最佳故障檢測模型并發送至數據庫;
交互組件調用執行組件以執行動作庫中的動作,通知并使用整理組件進行歸類標記以形成故障恢復用例集;
監控組件自數據庫獲取最佳故障檢測模型,并與整理組件實時采集的狀態數據進行對比,在對比成功后,調用故障檢測用例集中的實例,以對云主機進行故障標定。
作為本發明的進一步改進,所述采集組件部署于控制節點或者計算節點中;
所述數據庫、學習組件、交互組件、執行組件及監控組件僅部署于控制節點中。
作為本發明的進一步改進,所述狀態數據由系統基礎數據、系統服務日志及API返回結果共同描述;
所述系統基礎數據由CPU資源占用率、內存占用率、網卡流量中的至少一種構成;
所述API返回結果由具體的云主機與計算節點中其他的云主機之間或者控制節點之間所形成的數據;
所述系統服務日志為“/var/log/”目錄中的日志文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫華云數據技術服務有限公司,未經無錫華云數據技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811422877.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種軟件演示方法、系統和計算機設備
- 下一篇:信息處理方法及其裝置





