[發明專利]一種隔離故障PCIE設備的方法及系統有效
| 申請號: | 202010125180.1 | 申請日: | 2020-02-27 |
| 公開(公告)號: | CN111404725B | 公開(公告)日: | 2022-06-07 |
| 發明(設計)人: | 王琳慧;范鵬飛;孫建鑫 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | H04L41/0663 | 分類號: | H04L41/0663;H04L67/10 |
| 代理公司: | 濟南誠智商標專利事務所有限公司 37105 | 代理人: | 李修杰 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 隔離 故障 pcie 設備 方法 系統 | ||
本申請公開了一種隔離故障PCIE設備的方法及系統,該方法包括:首先搭建服務器集群,其次獲取PCIE設備所在子服務器的日志信息,然后比對該日志信息和設定的PCIE故障信息,判斷兩者是否有相同內容,如果是,判定當前子服務器發生PCIE設備故障,將故障信息反饋至主控服務器;主控服務器根據故障信息,將冗余PCIE設備接入發生PCIE設備故障的子服務器中,并斷開故障PCIE設備。該系統包括:集群搭建模塊、日志信息獲取模塊、比對模塊、故障信息反饋模塊和替換模塊。通過本申請,能夠準確定位故障,并有效提高PCIE設備故障處理效率。
技術領域
本申請涉及服務器故障處理技術領域,特別是涉及一種隔離故障PCIE(peripheral component interconnect express,一種高速串行計算機擴展總線標準)設備的方法及系統。
背景技術
隨著服務器性能的提高,用戶對服務器功能的要求也越來越多樣化,相應地,實現這些服務器功能的PCIE設備也越來越多樣化。每種服務器機型中所配置的PCIE設備并并完全相同,不同的PCIE設備具備不同的功能,如果某一種PCIE設備發生故障,就會導致服務器的相應功能中斷或系統宕機,進而造成服務器中重要數據的丟失等嚴重問題。因此,當服務器中PCIE設備發生故障時,如何發現故障并對故障PCIE設備進行處理,是個重要問題。
目前對故障PCIE設備的處理方法通常是,當服務器中的PCIE設備發生故障時,停止服務器運行,定位故障,確認故障后對服務器關機,手動更換故障PCIE設備。
然而,目前對故障PCIE設備的處理方法中,由于定位故障需要停止服務器運行,而且,從PCIE設備發生故障到更換完畢PCIE設備期間,服務器處于暫停運行或關機狀態,故障處理時間較長,嚴重影響服務器的運行,因此,目前的PCIE設備故障處理效率較低。
發明內容
本申請提供了一種隔離故障PCIE設備的方法及系統,以解決現有技術中PCIE設備故障處理效率較低的問題。
為了解決上述技術問題,本申請實施例公開了如下技術方案:
一種隔離故障PCIE設備的方法,所述方法包括:
搭建服務器集群,所述服務器集群中包括一個主控服務器和多個子服務器,所述主控服務器分別與多個子服務器協議連接,任一所述子服務器上設置有多個PCIE設備,所述主控服務器用于收集并處理多個子服務器的PCIE設備故障信息;
獲取PCIE設備所在子服務器的日志信息,所述日志信息包括:BMC(BaseboardManagement Controller,基板管理控制器)日志信息和系統日志信息;
比對所述日志信息和設定的PCIE故障信息;
判斷所述日志信息和設定的PCIE故障信息是否有相同內容;
如果是,判定當前子服務器發生PCIE設備故障;
將當前子服務器發生PCIE設備故障的故障信息反饋至主控服務器;
主控服務器根據所述故障信息,將冗余PCIE設備接入發生PCIE設備故障的子服務器中,并斷開故障PCIE設備,所述冗余PCIE設備安裝于所述主控服務器上。
可選地,比對所述日志信息和設定的故障信息的方法,具體為:
每隔設定的時間,比對一次所述日志信息和設定的故障信息。
可選地,所述將當前子服務器發生PCIE設備故障的故障信息反饋至主控服務器,包括:
將所述相同內容寫入當前子服務器的指定文件中;
讀取當前子服務器的所有PCIE設備信息,并將當前子服務器中所有PCIE設備的bus_id號追加至所述指定文件中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010125180.1/2.html,轉載請聲明來源鉆瓜專利網。





