[發明專利]故障識別模型訓練方法、故障識別方法、裝置及電子設備在審
| 申請號: | 202011164795.1 | 申請日: | 2020-10-27 |
| 公開(公告)號: | CN112308126A | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 杜鶴然;胡盼盼;盧道和 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F11/34;G06F16/35;G06F40/30 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 趙翠萍;張穎玲 |
| 地址: | 518027 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 故障 識別 模型 訓練 方法 裝置 電子設備 | ||
本發明公開了一種故障識別模型訓練方法、故障識別方法、裝置及電子設備。該故障識別模型訓練方法包括:基于至少一個第一時段中每個第一時段對應的時序數據,構建設定故障對應的至少一個正樣本和至少一個負樣本;基于所述設定故障對應的至少一個正樣本和至少一個負樣本,對設定的二分類模型進行訓練,得到所述設定故障對應的故障識別模型;其中,所述時序數據包括第一時序數據和第二時序數據;第一時序數據表征對應的第一時段的每個時刻輸出的日志信息量;第二時序數據表征至少一個性能指標中每個性能指標在對應的第一時段的每個時刻的監測數據。
技術領域
本發明涉及計算機技術領域,尤其涉及一種故障識別模型訓練方法、故障識別方法、裝置及電子設備。
背景技術
隨著計算機技術的發展,越來越多的技術應用在金融領域,傳統金融業正在逐步向金融科技(Fintech)轉變,然而,由于金融行業的安全性、實時性要求,金融科技也對技術提出了更高的要求。金融科技領域下,數據庫即服務(DBaaS,Database as a Service)是以傳統數據庫技術為基礎,將數據庫資源以標準服務的形式提供給一個或多個租戶的服務解決方案。
相關技術中,在用于提供DbaaS的服務器發生故障時,通常基于設定的性能指標的監測數據和DbaaS的相關日志對應的語義分析結果進行故障分析,得到分析結果。這種故障分析方法需要消耗大量時間分析所有日志文本的具體內容,以得到對應的語義分析結果,導致故障分析的效率較低。
發明內容
有鑒于此,本發明實施例期望提供一種故障識別模型訓練方法、故障識別方法、裝置及電子設備,以解決相關技術中故障分析的效率較低的技術問題。
為達到上述目的,本發明的技術方案是這樣實現的:
本發明實施例提供一種訓練故障識別模型的方法,包括:
基于至少一個第一時段中每個第一時段對應的時序數據,構建設定故障對應的至少一個正樣本和至少一個負樣本;
基于所述設定故障對應的至少一個正樣本和至少一個負樣本,對設定的二分類模型進行訓練,得到所述設定故障對應的故障識別模型;其中,
所述時序數據包括第一時序數據和第二時序數據;
第一時序數據表征對應的第一時段的每個時刻輸出的日志信息量;
第二時序數據表征至少一個性能指標中每個性能指標在對應的第一時段的每個時刻的監測數據。
上述方案中,所述方法還包括:
基于第一時段中每個時刻打印出的每條日志對應的第一信息量和第二信息量,計算出每條日志對應的總信息量;
基于第一時段中每個時刻打印出的每條日志對應的總信息量,得到對應的第一時段對應的第一時序數據;其中,
所述第一信息量表征日志對應的日志級別出現的第一概率;
所述第二信息量表征日志中包括的所有設定詞組中每個設定詞組在對應的日志級別中出現的第二概率。
上述方案中,所述方法還包括:
基于至少一個第一日志樣本中每個日志級別出現的次數,確定出每個日志級別對應的第一概率;
基于所述至少一個第一日志樣本中每個設定詞組在每個日志級別下出現的次數,確定出每個設定詞組在對應的日志級別中對應的第二概率;其中,
所述至少一個第一日志樣本通過對歷史日志進行采樣得到。
上述方案中,至少一個第一日志樣本中每個第一日志樣本均滿足以下條件:
第一日志樣本對應的日志級別對應的第一概率滿足設定條件;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011164795.1/2.html,轉載請聲明來源鉆瓜專利網。





