[發明專利]一種基于機器學習和文本分類的服務故障定位方法及裝置在審
| 申請號: | 202110392903.9 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113094198A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 許璟亮;廖鴻存;皇甫曉潔;周魁 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06N20/00;G06N3/04;G06N3/08;G06F40/279;G06K9/62 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 任默聞;王濤 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 文本 分類 服務 故障 定位 方法 裝置 | ||
1.一種基于機器學習和文本分類的服務故障定位方法,其特征在于,該方法包括:
抽取運維數據;
根據所述運維數據實時獲取集群日志數據及時序運行數據;
根據所述集群日志數據進行故障日志解析,得到服務運行時的監控指標,并根據服務執行的起止日志信息,得到服務執行耗時指標;
根據所述時序運行數據,得到容器級和服務級的資源監控指標;
根據所述服務運行時的監控指標、服務執行耗時指標及資源監控指標,利用故障判斷模型對故障根因進行分析判斷,得到故障根因分析結果;
根據所述故障根因分析結果,利用自然語言分類算法解析日志信息中的錯誤字段信息,對故障根因進行定位。
2.根據權利要求1所述的基于機器學習和文本分類的服務故障定位方法,其特征在于,抽取的運維數據至少包括:應用信息、節點信息及日志信息;
該方法還包括:
對所述應用信息、節點信息及日志信息進行格式化處理。
3.根據權利要求2所述的基于機器學習和文本分類的服務故障定位方法,其特征在于,根據所述運維數據實時獲取集群日志數據及時序運行數據,包括:
實時獲取日志信息流入并存儲到ES集群,得到集群日志數據;
實時獲取運行容器CPU、內存及磁盤IO信息。
4.根據權利要求1所述的基于機器學習和文本分類的服務故障定位方法,其特征在于,服務運行時的監控指標至少包括:請求書、請求成功率、請求正確率、請求響應時間及錯誤信息。
5.根據權利要求3所述的基于機器學習和文本分類的服務故障定位方法,其特征在于,所述容器級和服務級的資源監控指標至少包括:容器CPU、容器內存及宿主機IO在內的資源監控指標。
6.根據權利要求1所述的基于機器學習和文本分類的服務故障定位方法,其特征在于,根據所述服務運行時的監控指標、服務執行耗時指標及資源監控指標,利用故障判斷模型對故障根因進行分析判斷,得到故障根因分析結果,包括:
利用機器學習中機器學習中的樸素貝葉斯分類算法構建故障判斷模型,將服務運行時的監控指標、服務執行耗時指標及資源監控指標的歷史數據作為輸入特征,將判斷結果作為輸出特征,對故障判斷模型進行訓練;其中,所述故障判斷模型是有監督的機器學習模型,用于進行多因子預測模型判斷;
將新產生的服務運行時的監控指標、服務執行耗時指標及資源監控指標作為輸入特征,利用故障判斷模型進行故障判斷,得到故障發生概率。
7.根據權利要求6所述的基于機器學習和文本分類的服務故障定位方法,其特征在于,該方法還包括:
在模型判斷故障發生概率大于預設值時,輔助進行CPU、內存、服務執行成功率的矯正判斷,得到矯正后的故障根因分析結果。
8.根據權利要求4所述的基于機器學習和文本分類的服務故障定位方法,其特征在于,根據所述故障根因分析結果,利用自然語言分類算法解析日志信息中的錯誤字段信息,對故障根因進行定位,包括:
將歷史錯誤信息作為輸入值進行數據標注,構建淺層網絡模型;
將新的錯誤信息輸入至所述淺層網絡模型,采用淺層網絡模型的自然語言分類算法解析日志信息中的錯誤字段,得到分類判斷結果,對故障根因進行定位。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110392903.9/1.html,轉載請聲明來源鉆瓜專利網。





