[發明專利]云主機異常故障檢測恢復系統、方法及云平臺有效
| 申請號: | 201811422877.4 | 申請日: | 2018-11-27 |
| 公開(公告)號: | CN109522095B | 公開(公告)日: | 2020-04-10 |
| 發明(設計)人: | 許廣彬;張建峰;譚瑞忠 | 申請(專利權)人: | 無錫華云數據技術服務有限公司 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455;G06F11/30 |
| 代理公司: | 蘇州友佳知識產權代理事務所(普通合伙) 32351 | 代理人: | 儲振 |
| 地址: | 214000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 主機 異常 故障 檢測 恢復 系統 方法 平臺 | ||
1.云主機異常故障檢測恢復系統,其特征在于,包括:采集組件(30),整理組件(40)、內置動作庫(501)的數據庫(50)、學習組件(60)、交互組件(70)、執行組件(80)及監控組件(90);
采集組件(30)采集狀態數據,使用整理組件(40)進行歸類標記以形成故障檢測用例集與正常用例集;
學習組件(60)提取故障檢測用例集,訓練得到最佳故障檢測模型并發送至數據庫(50);
交互組件(70)調用執行組件(80)以執行動作庫(501)中的動作,通知并使用整理組件(40)進行歸類標記以形成故障恢復用例集;
監控組件(90)自數據庫(50)獲取最佳故障檢測模型,并與整理組件(40)實時采集的狀態數據進行對比,在對比成功后,調用故障檢測用例集中的實例,以對云主機進行故障標定。
2.根據權利要求1所述的云主機異常故障檢測恢復系統,其特征在于,所述采集組件(30)部署于控制節點(10)或者計算節點(20)中;
所述數據庫(50)、學習組件(60)、交互組件(70)、執行組件(80)及監控組件(90)僅部署于控制節點(10)中。
3.根據權利要求1所述的云主機異常故障檢測恢復系統,其特征在于,所述狀態數據由系統基礎數據、系統服務日志及API返回結果共同描述;
所述系統基礎數據由CPU資源占用率、內存占用率、網卡流量中的至少一種構成;
所述API返回結果由具體的云主機與計算節點(20)中其他的云主機之間或者控制節點(10)之間所形成的數據;
所述系統服務日志為“/var/log/”目錄中的日志文件。
4.根據權利要求3所述的云主機異常故障檢測恢復系統,其特征在于,所述使用整理組件(40)進行歸類標記以形成故障檢測用例集與正常用例集具體為:
整理組件(40)在設定時間段內的系統基礎數據及系統服務日志進行轉換標簽處理,以形成第一類標簽;
將相同的設定時間段內的API返回結果進行轉換標簽處理,當API返回結果符合故障類型時轉換為第一類特征碼,當API返回結果符合非故障類型時轉換為第二類特征碼;
將設定時間段與第一類標簽及第一類特征碼進行關聯,以形成故障檢測用例集中的一個用例,將設定時間段與第一類標簽及第二類特征碼進行關聯,以形成正常用例集中的一個用例。
5.根據權利要求3所述的云主機異常故障檢測恢復系統,其特征在于,所述學習組件(60)訓練得到最佳故障檢測模型具體為:
所述學習組件(60)提取故障檢測用例集并按照設定比例將故障檢測用例集中的用例劃分為故障檢測訓練集、故障檢測驗證集與故障檢測測試集,并基于機器學習算法訓練得到最佳故障檢測模型;
其中,故障檢測訓練集、故障檢測驗證集與故障檢測測試集的劃分比例為:8:1:1。
6.根據權利要求5所述的云主機異常故障檢測恢復系統,其特征在于,所述機器學習算法為決策樹算法、樸素貝葉斯算法、最小二乘法、支持向量機算法、聚類算法、主成分分析法或者獨立成分分析法。
7.根據權利要求1所述的云主機異常故障檢測恢復系統,其特征在于,所述交互組件(70)接收自定義故障輸入,以對數據庫(50)中留存的最佳故障檢測模型進行更新;其中,所述最佳故障檢測模型的數量僅為一個。
8.根據權利要求1所述的云主機異常故障檢測恢復系統,其特征在于,所述故障檢測用例集、正常用例集及故障恢復用例集均保存于數據庫(50)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫華云數據技術服務有限公司,未經無錫華云數據技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811422877.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種軟件演示方法、系統和計算機設備
- 下一篇:信息處理方法及其裝置





