[發明專利]一種基于機器學習的智能運維機器人系統有效
| 申請號: | 201810000055.0 | 申請日: | 2018-01-01 |
| 公開(公告)號: | CN107943098B | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 余紹詳 | 申請(專利權)人: | 深圳通聯金融網絡科技服務有限公司 |
| 主分類號: | G05D1/10 | 分類號: | G05D1/10;G06N20/00 |
| 代理公司: | 合肥市科融知識產權代理事務所(普通合伙) 34126 | 代理人: | 張高飛 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 智能 機器人 系統 | ||
本發明提供了一種基于機器學習的智能運維機器人系統,包括后臺處理端、運維數據庫以及若干運維機器人,所述故障學習策略包括當所述異常信號被輸出到后臺處理端時,根據所述后臺處理端輸入的處理結果生成一新的所述處理策略,并將新地所述處理策略存入所述運維數據庫,并根據所述處理策略對應的故障參數通過一參數波動值生成一故障參數范圍,根據所述處理策略對應的故障時間通過一時間波動值生成一故障時間范圍,生成故障時間在所述故障時間范圍內且故障參數在所述故障參數范圍內的新的異常信號,關聯所述新的異常信號和新的所述處理策略。
技術領域
本發明涉及智能運維機器人技術領域,具體是涉及一種基于機器學習的智能運維機器人系統。
背景技術
運維工程師(Operations),負責維護并確保整個服務的高可用性,同時不斷優化系統架構、提升部署效率、優化資源利用率提高整體的ROI.
運維工程師面對的最大挑戰是大規模集群的管理問題,如何管理好幾十萬臺服務器上的服務,同時保障服務的高可用性,是運維工程師面臨的最大挑戰。在軟件產品的整個生命周期中運維工程師都需要適時地參與并發揮不同得作用,因此運維工程師的工作內容和方向非常多:
事件管理:目標是在服務出現異常時盡可能快速的恢復服務,從而保障服務的可用性;同時深入分析故障產生的原因,推動并修復服務存在的問題,同時設計并開發相關的預案以確保服務出現故障時可以高效的止損。在這方面主要工作內容有:
問題發現:設計并開發高效的監控平臺和告警平臺,使用機器學習、大數據分析等方法對系統中的大量監控數據進行匯總分析,以期在系統出現異常的時候可以快速的發現問題和判斷故障的影響。
問題處理:設計并開發高效的問題處理平臺和工具,在系統出現異常的時候可以快速/自動決策并觸發相關止損預案,快速恢復服務。
問題跟蹤:通過分析問題發生時系統的各種表現(日志、變更、監控)確定問題發生的根本原因,制定并開發預案工具。
變更管理:以可控的方式,盡可能高效的完成產品功能的迭代的變更工作。在這方面運主要工作內容有:
配置管理:通過配置管理平臺(自研、開源)管理服務涉及到的多個模塊、多個版本的關系以及配置的準確性。
發布管理:通過構建自動化的平臺確保每一次版本變更可以安全可控地發布到生產環境。
容量管理:在服務運行維護階段,為了確保服務架構部署的合理性同時掌握服務整體的冗余,需要不斷評估系統的承載能力,并不斷優化之。在這方面主要工作內容有:
容量評估:通過技術手段模擬實際的用戶請求,測試整個系統所能承擔的最大吞吐;通過建立容量評估模型分析壓力測試過程中的數據以評估整個服務的容量。
容量優化:基于容量評估數據,判斷系統的瓶頸并提供容量優化的解決方案。比如通過調整系統參數、優化服務部署架構等方法來高效的提升系統容量。
架構優化:為了支持產品的不斷迭代,需要不斷的進行架構優化調整。以確保整個產品能夠在功能不斷豐富和復雜的條件下,同時保持高可用性。
而市場上目前推出了一種運維機器人,可以代替運維工程師以解決系統運維的問題,但是這種運維機器人只能根據實際情況作出應對,不具有自主學習的能力,所以導致在配置運維機器人時所做的工作較為繁瑣,造成了較大的設計成本,且無法適應實際的使用需求,根據實際使用的需求情況作出應對。
發明內容
針對現有技術中存在的上述問題,現旨在提供一種基于機器學習的智能運維機器人系統,以解決上述問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳通聯金融網絡科技服務有限公司,未經深圳通聯金融網絡科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810000055.0/2.html,轉載請聲明來源鉆瓜專利網。





