[發明專利]一種基于機器學習和文本分類的服務故障定位方法及裝置在審
| 申請號: | 202110392903.9 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113094198A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 許璟亮;廖鴻存;皇甫曉潔;周魁 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06N20/00;G06N3/04;G06N3/08;G06F40/279;G06K9/62 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 任默聞;王濤 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 文本 分類 服務 故障 定位 方法 裝置 | ||
本發明公開了一種基于機器學習和文本分類的服務故障定位方法及裝置,可以用于集群故障定位技術領域,其中,該方法包括:抽取運維數據;根據所述運維數據實時獲取集群日志數據及時序運行數據;根據所述集群日志數據進行故障日志解析,得到服務運行時的監控指標,并根據服務執行的起止日志信息,得到服務執行耗時指標;根據所述時序運行數據,得到容器級和服務級的資源監控指標;根據所述服務運行時的監控指標、服務執行耗時指標及資源監控指標,利用故障判斷模型對故障根因進行分析判斷,得到故障根因分析結果;根據所述故障根因分析結果,利用自然語言分類算法解析日志信息中的錯誤字段信息,對故障根因進行定位。
技術領域
本發明涉及集群故障定位技術領域,尤指一種基于機器學習和文本分類的服務故障定位方法及裝置。
背景技術
在現有技術中,故障定位通常采用指標監控加人工分析判斷的方式進行,如對服務器運行內存、CPU進行監控,超過閾值觸發報警,然后人工介入進行故障分析和修復。這種處理方式至少存在以下不足:故障定位慢,通常需要人工接入才能進行故障原因分類定位和判斷。檢出率低,由于采用固定的指標監控算法,無法覆蓋全部的場景,故障檢出率有限;如CPU指標監控通常只能采取靜態臨界值。誤報率高,對于內存CPU毛刺場景無法有效識別,造成故障檢測誤報率較高。
綜上來看,亟需一種可以克服現有技術存在的不足,具有定位速度快,檢出率高,誤報率低的故障定位方案。
發明內容
針對現有故障定位存在的缺陷,為解決傳統方式大量依賴人工介入,監控故障檢出率低,問題定位慢的問題,本發明提出了一種基于機器學習和文本分類的服務故障定位方法及裝置;本發明通過自主開發數據采集、數據預處理、預測與監控報警等處理方法,能夠對實時服務信息進行相關數據采集、預處理、故障分析和故障分類等操作,實現對系統故障的快速定位和分類,可以有效提高系統報警準確率和有效性。
具體的,在本發明實施例的第一方面,提出了一種基于機器學習和文本分類的服務故障定位方法,該方法包括:
抽取運維數據;
根據所述運維數據實時獲取集群日志數據及時序運行數據;
根據所述集群日志數據進行故障日志解析,得到服務運行時的監控指標,并根據服務執行的起止日志信息,得到服務執行耗時指標;
根據所述時序運行數據,得到容器級和服務級的資源監控指標;
根據所述服務運行時的監控指標、服務執行耗時指標及資源監控指標,利用故障判斷模型對故障根因進行分析判斷,得到故障根因分析結果;
根據所述故障根因分析結果,利用自然語言分類算法解析日志信息中的錯誤字段信息,對故障根因進行定位。
進一步的,抽取的運維數據至少包括:應用信息、節點信息及日志信息;
該方法還包括:
對所述應用信息、節點信息及日志信息進行格式化處理。
進一步的,根據所述運維數據實時獲取集群日志數據及時序運行數據,包括:
實時獲取日志信息流入并存儲到ES集群,得到集群日志數據;
實時獲取運行容器CPU、內存及磁盤IO信息。
進一步的,服務運行時的監控指標至少包括:請求書、請求成功率、請求正確率、請求響應時間及錯誤信息。
進一步的,所述容器級和服務級的資源監控指標至少包括:容器CPU、容器內存及宿主機IO在內的資源監控指標。
進一步的,根據所述服務運行時的監控指標、服務執行耗時指標及資源監控指標,利用故障判斷模型對故障根因進行分析判斷,得到故障根因分析結果,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110392903.9/2.html,轉載請聲明來源鉆瓜專利網。





