[發明專利]一種基于機器學習方式形成故障規則庫的方法在審
| 申請號: | 201710828211.8 | 申請日: | 2017-09-14 |
| 公開(公告)號: | CN107644256A | 公開(公告)日: | 2018-01-30 |
| 發明(設計)人: | 郭美思 | 申請(專利權)人: | 鄭州云海信息技術有限公司 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02;G06F11/07 |
| 代理公司: | 濟南信達專利事務所有限公司37100 | 代理人: | 姜明 |
| 地址: | 450000 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 方式 形成 故障 規則 方法 | ||
技術領域
本發明涉及計算機應用技術領域,特別涉及一種基于機器學習方式形成故障規則庫的方法。
背景技術
隨著時代的發展,人們生活水平的提高,人們的生活方式及工作方式都發生了變化,計算機已經成為人們日常生活中不可替代的設備。
當計算機出現故障時,技術人員只能通過查看日志信息進行排查,非常耗時。而且由于計算機操作系統組件相對比較復雜,產生的故障的原因有很多,日志信息數量巨大。當計算機出現故障時,需要技術人員手動查看日志信息進行分析,找到相應的故障信息,解決出現的故障問題,因此技術人員想要迅速確定故障原因是非常困難的。
現有技術沒有使用通用的故障規則庫,計算機發生故障時只能費時費力的人工排查。針對這種情況,本發明設計了一種基于機器學習方式形成故障規則庫的方法。
發明內容
本發明為了彌補現有技術的缺陷,提供了一種簡單高效的基于機器學習方式形成故障規則庫的方法。
本發明是通過如下技術方案實現的:
一種基于機器學習方式形成故障規則庫的方法,其特征在于,包括以下步驟:
(1)故障訓練集選取,獲取故障信息及解決方案,提煉出故障規則庫字段;
(2)機器學習算法訓練,采用隨機森林算法,自動識別故障并挖掘故障現象與故障規則的關系;
(3)專家評判錄入故障規則,對自動識別出的故障進行專家評審,將有效的故障現象及處理方案生成故障規則,存放到故障規則庫中。
所述步驟(1)中,故障訓練集選取是通過客戶現場,研發部門,測試部門和運維人員獲取的故障信息及解決方案,提煉出故障規則庫字段;同時,訓練集中的數據準確定位到具體設備,深入分析故障原因。
所述故障規則庫字段包括故障名稱,機器型號,操作系統,故障部位,故障模型,故障類型,日志級別,日志詳細信息,關鍵字,日志路徑,問題描述和解決辦法。
訓練集中的數據準確定位到CPU和內存故障時,讀取CPU事件及內存事件,解析mcelog,定位故障CPU及內存位置;定位PCIE故障,讀取PCIE事件,根據機器絲印對照表,匹配出對應的插槽信息;定位CallTrace故障報錯程序段,分析CallTrace事件日志,挖掘函數調用棧,深入分析故障原因。
所述步驟(2)中,機器學習算法訓練,采用隨機森林算法,生成由決策樹組成的森林,對故障信息進行歸并處理,通過多棵決策樹對故障現象進行投票,判斷故障,并采取相應的解決辦法。
本發明的有益效果:該基于機器學習方式形成故障規則庫的方法,根據日常故障的規律及處理辦法形成一個故障規則庫,當故障再次發生時,查看故障規則庫中的信息即可找到相應的解決辦法,大大提高了故障排查的效率。
附圖說明
附圖1為本發明基于機器學習方式形成故障規則庫的方法示意圖。
具體實施方式
為了使本發明所要解決的技術問題、技術方案及有益效果更加清楚明白,以下結合附圖和實施例,對本發明進行詳細的說明。應當說明的是,此處所描述的具體實施例僅用以解釋本發明,并不用于限定本發明。
該基于機器學習方式形成故障規則庫的方法,包括:故障訓練集選取,機器學習算法訓練和專家評判錄入故障規則三部分。
所述故障訓練集選取是指通過客戶現場、研發部門、測試部門、運維人員獲取的故障信息及解決方案,提煉出故障規則庫字段,保證故障診斷的完備性和精確性;訓練集中的數據準確定位到具體設備,例如定位CPU和內存故障時,讀取CPU事件及內存事件,解析mcelog,定位故障CPU及內存位置;定位PCIE故障,讀取PCIE事件,根據機器絲印對照表,匹配出對應的插槽信息;定位CallTrace故障報錯程序段,分析CallTrace事件日志,挖掘函數調用棧,深入分析故障原因。
故障規則庫字段包括故障名稱、機器型號、操作系統、故障部位、故障模型、故障類型、日志級別、日志詳細信息、關鍵字、日志路徑、問題描述、解決辦法。
所述機器學習算法訓練是指采用隨機森林算法,實現故障的自動識別,挖掘故障現象與故障規則的關系。基于隨機森林算法規則,生成由決策樹組成的森林,對故障信息進行歸并處理,通過多棵決策樹對故障現象進行投票,判斷故障,采取相應的措施。采用機器學習算法訓練的方法自動識別故障,將人工完成的事情交給系統自動完成,能夠節省運維成本,提高工作效率。
所述專家評判錄入故障規則是指對自動識別出的故障進行專家評審,將有效的故障現象及處理方案生成故障規則,存放到故障規則庫中。當故障再次發生的時候,查看故障規則庫中的信息即可找到相應的解決方案,大大提高了故障排查的效率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州云海信息技術有限公司,未經鄭州云海信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710828211.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種紅綠燈自動路障器
- 下一篇:一種減速帶





