[發明專利]基于核內外協同的高可用計算機系統故障處理方法及裝置有效
| 申請號: | 201410215175.4 | 申請日: | 2014-05-21 |
| 公開(公告)號: | CN103995759A | 公開(公告)日: | 2014-08-20 |
| 發明(設計)人: | 廖湘科;顏躍進;李俊良;劉曉建;楊沙洲;姚望;汪黎;秦瑩;周強;王非 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F11/22 | 分類號: | G06F11/22 |
| 代理公司: | 湖南兆弘專利事務所 43008 | 代理人: | 趙洪;譚武藝 |
| 地址: | 410073 湖南省長沙市硯瓦池正*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 內外 協同 可用 計算機 系統故障 處理 方法 裝置 | ||
1.一種基于核內外協同的高可用計算機系統故障處理方法,其特征在于實施步驟如下:
1)在操作系統內核外檢測包含系統服務故障和應用服務故障在內的服務故障生成故障報告并通過所述故障報告接口輸出,同時在操作系統內核中檢測硬件故障生成故障報告并通過在操作系統內核外建立的故障報告接口輸出;
2)在操作系統內核外檢測故障報告接口的故障報告,在收到故障報告后對故障報告進行分析,根據分析結果在操作系統內核中對硬件故障對應的硬件進行故障處理,或者在操作系統內核外對服務故障對應的服務進行故障處理,對故障處理記錄日志并向管理員發送通知,然后根據預設的規則判斷是否需要進行雙機熱備,如果需要雙機熱備則通知指定的雙機熱備軟件進行雙機熱備。
2.根據權利要求2所述的基于核內外協同的高可用計算機系統故障處理方法,其特征在于:所述步驟1)中在操作系統內核外檢測包含系統服務故障和應用服務故障在內的服務故障生成故障報告并通過所述故障報告接口輸出具體是指:
1.1.1)在操作系統內核外以輪詢的方式對操作系統中系統服務和應用服務進行狀態檢測,如果任意系統服務或者應用服務出現異常狀態,則判定發生服務故障;
1.1.2)在判定發生服務故障后,根據系統服務或者應用服務出現異常狀態的信息生成故障報告,將所述故障報告通過所述故障報告接口輸出。
3.根據權利要求2所述的基于核內外協同的高可用計算機系統故障處理方法,其特征在于,所述步驟1)中在操作系統內核中檢測硬件故障生成故障報告并通過所述故障報告接口輸出的詳細步驟如下:
1.2.1)通過預先分布在故障注入接口、故障中斷處理例程和硬件驅動中的多個硬件狀態監測點檢測對應的硬件狀態信息,如果任意硬件狀態監測點檢測的硬件狀態發生異常,則所述硬件狀態監測點根據預設的規則收集對應硬件的現場數據作為硬件故障數據;
1.2.2)將硬件故障數據進行封裝生成故障報告并存入預設的故障消息隊列;
1.2.3)根據故障消息隊列對存入故障消息隊列的故障報告進行調度分發;
1.2.4)利用線程將調度輸出的故障報告通過所述故障報告接口輸出。
4.根據權利要求3所述的基于核內外協同的高可用計算機系統故障處理方法,其特征在于,所述步驟2)的詳細步驟如下:
2.1)在操作系統內核外基于守護進程檢測故障報告接口的故障報告;
2.2)在操作系統內核外在收到故障報告后對故障報告進行分析,判斷故障報告的故障類型,如果故障類型為服務故障,則根據服務依賴關系描述對服務故障對應的系統服務或者應用服務進行恢復;如果故障類型為硬件故障,則判斷是否需要對故障報告對應的硬件進行故障硬件隔離,如果需要進行故障硬件隔離則跳轉執行步驟2.3),否則判斷是否需要對故障報告對應的硬件進行故障硬件恢復,如果需要進行故障硬件恢復則跳轉執行步驟2.4),否則跳轉執行步驟2.5);
2.3)在需要對故障報告對應的硬件進行故障硬件隔離時,在操作系統內核中對故障報告對應的硬件進行故障硬件隔離;
2.4)在需要對故障報告對應的硬件進行故障硬件恢復時,在操作系統內核中對故障報告對應的硬件進行故障硬件恢復;
2.5)對故障處理記錄日志;
2.6)向管理員發送通知;
2.7)根據預設的規則判斷是否需要進行雙機熱備,如果需要雙機熱備則通過調用指定的雙機熱備軟件的通知插件,通知所述雙機熱備軟件進行雙機熱備。
5.一種基于核內外協同的高可用計算機系統故障處理裝置,其特征在于包括:
故障統一報告子系統,用于在操作系統內核外檢測包含系統服務故障和應用服務故障在內的服務故障生成故障報告并通過所述故障報告接口輸出,同時在操作系統內核中檢測硬件故障生成故障報告并通過在操作系統內核外建立的故障報告接口輸出;
故障統一處置子系統,用于在操作系統內核外檢測故障報告接口的故障報告,在收到故障報告后對故障報告進行分析,根據分析結果在操作系統內核中對硬件故障對應的硬件進行故障處理,或者在操作系統內核外對服務故障對應的服務進行故障處理,對故障處理記錄日志并向管理員發送通知,然后根據預設的規則判斷是否需要進行雙機熱備,如果需要雙機熱備則通知指定的雙機熱備軟件進行雙機熱備。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410215175.4/1.html,轉載請聲明來源鉆瓜專利網。





