[發明專利]一種基于專家系統方法的計算機故障管理系統有效
| 申請號: | 201010135370.8 | 申請日: | 2010-03-30 |
| 公開(公告)號: | CN101833497A | 公開(公告)日: | 2010-09-15 |
| 發明(設計)人: | 吳楠;張東 | 申請(專利權)人: | 山東高效能服務器和存儲研究院 |
| 主分類號: | G06F11/34 | 分類號: | G06F11/34 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 專家系統 方法 計算機 故障 管理 系統 | ||
技術領域
本發明涉及一種計算機故障管理系統,尤其是涉及一種基于專家系統方法的計算機故障管理系統。
技術背景
隨著現代社會的不斷發展,計算機系統已經深入而廣泛地應用于醫療衛生、教育、工業生產、交通運輸、金融、科學研究、軍事等各領域之中。支撐關鍵應用的計算機系統一旦出現故障,往往會造成巨大的經濟損失,甚至可能影響社會的安定與經濟的運行。在此背景下,計算機系統的可靠性越來越多地得到人們的關注和重視。然而與此同時,計算機系統的結構日益復雜,規模不斷增大,使得計算機系統的可靠性面臨愈發嚴峻的困難和挑戰。
計算機系統的可靠性由硬件可靠性和軟件可靠性共同決定。將系統在觀測期中正常運行的時間總和記作PT,將觀測期中各次故障發生到相應故障被檢測出的時間總和記作DT,將觀測期中用于等待和準備恢復軟件故障的時間總和記作PreST,將觀測期中用于恢復軟件故障的時間總和記作ST,將觀測期中用于等待和準備恢復硬件故障的時間總和記作PreHT,將觀測期中恢復硬件故障的時間總和記作HT,為說明簡便計,不妨假設PreST、ST、PreHT、HT均無重疊,則有系統可靠性R=PT/(DT+PreST+ST+PreHT+HT)。由此可知,提高計算機系統可靠性的根本方法就是減少系統中軟、硬件故障的發生,以及在故障發生后及早發現并盡快恢復。
現有的計算機故障管理方法較好地應用于部件級系統中,但往往缺乏面向整體系統的結構性設計,也未見將故障管理作為完整子系統納入計算機系統的總體設計中,因而多無法對局部的計算機故障施以全局優選的處理;其次,現有的計算機故障管理方法一般過分依賴人工參與,這通常會顯著地增加等待和準備處理故障的時間,并且由于個體技術水平和認知能力的差異,也增大了處理不當甚至是錯誤處理的可能;再者,現有的計算機故障管理方法大多僅關注特定硬件或特定軟件的故障,通用性和可擴展性較差。
專家系統是具備專門知識和經驗的計算機智能程序系統,采用人工智能中的知識表示和知識推理技術來實現通常只能由領域專家解決的復雜問題。近年來,專家系統已經應用到眾多領域,數量眾多的專家系統在功能上已達到,甚至超過同領域中人類專家的水平,并在實際應用中產生了巨大的經濟效益和社會效益。
發明內容
本發明的目的是提供一種基于專家系統方法的計算機故障管理系統,以彌補現有主流計算機故障管理方法的不足:
本發明的目的是按以下方式實現的,計算機故障管理系統由數據采集器、故障事件生成模塊、故障診斷引擎、知識庫、知識獲取模塊、故障隔離模塊、故障恢復模塊、故障預警模塊、日志服務模塊、故障管理注冊模塊以及人機交互界面組成。
系統的故障處理工作流程如下:若干個數據采集器監視目標系統的硬件、操作系統及應用程序的運行并采集其運行狀態關鍵信息,發送至故障事件生成模塊;故障事件生成模塊格式化數據采集器提交的原始數據,輸出故障診斷引擎能夠識別的故障事件;故障診斷引擎根據故障事件生成模塊輸出的故障事件結合知識庫中的故障診斷專家知識,采用數據驅動控制策略推理匹配的故障處理規則,繼而觸發故障隔離模塊、故障恢復模塊、故障預警模塊實施后續的故障處理;故障隔離模塊根據故障診斷模塊輸出的故障處理策略邏輯地隔離指定故障組件,以限制故障擴散范圍并作為后續故障處理的前置條件;故障恢復模塊根據故障診斷模塊輸出的故障處理策略,恢復指定故障組件的功能或運行狀態;故障預警模塊根據故障診斷模塊輸出的故障處理策略,采用閾值算法對目標系統可能產生的故障進行預測并發送預警信息。
知識庫包含以規則形式表達的故障診斷知識,診斷規則由規則描述、匹配條件集和方法集構成;
知識獲取模塊采用指導注入式的學習策略,通過人機交互界面向領域專家提供智能編輯器,以實現知識庫的擴充。
日志服務模塊向故障事件生成模塊、故障診斷引擎、故障隔離模塊、故障恢復模塊以及故障預警模塊提供基于網絡的日志記錄接口。
故障事件生成模塊記錄生成格式化故障事件的相關信息;
故障診斷引擎記錄推理故障事件處理規則的相關信息;
故障隔離模塊記錄隔離指定故障組件的相關信息;
故障恢復模塊記錄恢復指定故障組件的相關信息;
故障預警模塊記錄預測故障的相關信息。
日志信息能夠清楚地反映出故障管理系統自身的運行情況,更準確而完整地記錄著故障管理系統所管理的目標系統中產生故障的詳細信息,是相關人員分析與改進目標計算機系統可靠性的重要依據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東高效能服務器和存儲研究院,未經山東高效能服務器和存儲研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010135370.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種雙控制器通信系統和方法
- 下一篇:一種薄壁鉆焊接機中的筒體定位裝置





