[發明專利]一種混合云管的異常實時上報方法、系統、設備和介質有效
| 申請號: | 202310068437.8 | 申請日: | 2023-02-06 |
| 公開(公告)號: | CN115801545B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 李德棟 | 申請(專利權)人: | 天翼云科技有限公司 |
| 主分類號: | H04L41/0631 | 分類號: | H04L41/0631;H04L41/0681;H04L43/08;H04L43/04 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 任亞娟 |
| 地址: | 100093 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 混合 異常 實時 上報 方法 系統 設備 介質 | ||
本發明實施例中提供了一種混合云管的異常實時上報方法、系統、設備和介質,所述方法包括:利用集成prometheus服務獲取混合云管系統的原始metrics數據;對所述原始metrics數據進行聚類,得到metrics數據;按照邏輯組合對所述metrics數據進行處理,得到場景數據;在所述場景數據和/或所述metrics數據觸發報警條件的情況下,上報異常信息。在本發明實施例中,將以往被動發現問題轉變為主動發現問題,進而有效的提高混合云管系統各類功能操作失敗情況的發現、定位效率,提升系統異常捕獲覆蓋度,為混合云管系統提供了實時、準確的持續優化能力,從而有效提升用戶滿意度。
技術領域
本發明涉及云計算中的邏輯可用性監測領域,特別涉及一種混合云管的異常實時上報方法、系統、設備和介質。
背景技術
在國家云的大背景下,很多政企單位業務遍布全國,且對云計算的需求越來越多樣化,由此,私有云+公有云的混合云形態逐漸成為政企云業務的發展趨勢,然而伴隨混合云多樣化能力而來的是更復雜的部署架構和使用場景,所以發現系統中問題與異常的難度也呈指數級增長,尤其是系統交付后的生產環境問題。
目前,大部分云廠商對云管業務異常處理的主要方案是通過記錄運行日志,或在用戶使用出現異常時聯系運維人員,運維人員介入處理,或先提交缺陷,待開發人員定期排查解決。這類上報方法更關注當前使用的業務功能,對關聯功能和非關注功能關注度低,進而覆蓋度低;由于人工介入過多,導致實時性差,且成本極高。
發明內容
鑒于上述問題,本發明實施例提供了一種混合云管的異常實時上報方法、系統、設備和介質,以便克服上述問題或者至少部分地解決上述問題。
本發明實施例的第一方面,公開了一種混合云管的異常實時上報方法,應用于集成prometheus服務,所述方法包括:
利用集成prometheus服務獲取混合云管系統的原始metrics數據;
對所述原始metrics數據進行聚類,得到metrics數據;
按照邏輯組合對所述metrics數據進行處理,得到場景數據;
在所述場景數據和/或所述metrics數據觸發報警條件的情況下,上報異常信息。
可選地,所述利用集成prometheus服務獲取混合云管系統的原始metrics數據,包括:
利用所述集成prometheus服務,按照預設時間間隔定時向所述混合云管系統發送原始metrics數據獲取請求;
接收所述混合云管系統返回的原始metrics數據;
對所述原始metrics數據進行聚類,得到metrics數據,包括:
按照云系統、資源池、主功能、子功能對所述原始metrics數據進行聚類,得到metrics數據。
可選地,按照邏輯組合對所述metrics數據進行處理,得到場景數據,包括:
按照云系統、資源池、主功能、子功能分類,分別對各類別在預設時間內的metrics數據進行處理,得到各類別在預設時間內的場景數據。
可選地,所述在所述場景數據和/或所述metrics數據觸發報警條件的情況下,上報異常信息,包括:
基于grafana可視化平臺制定報警規則,在所述場景數據和/或所述metrics數據滿足報警條件的情況下,上報所述場景數據和/或所述metrics數據對應的異常信息。
可選地,在同時上報多個異常信息的情況下,所述方法還包括:
利用alertmanager模塊判斷同時上報的多個異常信息是否相同;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天翼云科技有限公司,未經天翼云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310068437.8/2.html,轉載請聲明來源鉆瓜專利網。





