[發明專利]一種服務器PCIe設備故障記錄的系統及方法在審
| 申請號: | 201811434099.0 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109542752A | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 孫一心 | 申請(專利權)人: | 鄭州云海信息技術有限公司 |
| 主分類號: | G06F11/34 | 分類號: | G06F11/34 |
| 代理公司: | 濟南誠智商標專利事務所有限公司 37105 | 代理人: | 王汝銀 |
| 地址: | 450018 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 故障記錄 黑盒 故障位置信息 寄存器 服務器 配置空間寄存器 寄存器讀取 日志保留 信息漏失 觸發 日志 分析 中斷 監控 檢測 記錄 | ||
1.一種服務器PCIe設備故障記錄的系統,其特征在于,包括:
CPU單元:用于存儲PCIe設備配置空間寄存器;
BIOS單元:用于當BIOS單元監控到PCIe設備發生UCE故障時,收集故障PCIe設備的寄存器的值和故障信息;所述寄存器的值和故障信息位于CPU單元空間寄存器中的AERcapability中;
BMC單元:用于通過impi命令接收從BIOS單元發送的寄存器的值和故障位置信息;同時將寄存器的值和故障位置信息記錄到黑盒日志中;
黑盒日志:用于記錄寄存器的值和故障位置信息,并根據所述寄存器的值對寄存器進行解析;
所述BIOS單元通過PECI鏈路與CPU單元數據通信;所述BMC單元通過KCS鏈路與BIOS單元數據通信。
2.根據權利要求1所述的一種服務器PCIe設備故障記錄的系統,其特征在于,所述故障PCIe設備的寄存器包括uncorrectable error status register、correctable errorstatus register和header log register。
3.根據權利要求1所述的一種服務器PCIe設備故障記錄的系統,其特征在于,所述故障信息的類型包括uncorrectable fatal error、correctable non-fatal error和correctable error。
4.根據權利要求1所述的一種服務器PCIe設備故障記錄的系統,其特征在于,所述BIOS單元包括監測單元和收集單元;
所述監測單元用于檢測PCIe設備是否發生UCE故障;
所述收集單元用于收集故障PCIe設備的寄存器的值和故障信息。
5.根據權利要求1所述的一種服務器PCIe設備故障記錄的系統,其特征在于,所述BMC單元包括接收模塊和寫入模塊;
所述接收模塊用于通過impi命令接收從BIOS單元發送的寄存器的值和故障位置信息;所述寫入模塊用于將寄存器的值和故障位置信息記錄到黑盒日志中。
6.一種服務器PCIe設備故障記錄的方法,是基于權利要求1至5任意一項所述的一種服務器PCIe設備故障記錄的系統實現的,其特征在于,包括以下步驟:
S1:當BIOS單元監控到PCIe設備發生UCE故障時,將PCIe設備配置空間寄存器中的AERcapability寄存器收集出來,并將所述AER capability寄存器的值以及故障位置信息通過impi命令發送給BMC;
S2:BMC單元接收所述AER capability寄存器的值以及故障位置信息,并將所述AERcapability寄存器的值以及故障位置信息記錄到黑盒日志中。
7.根據權利要求6所述的一種服務器PCIe設備故障記錄的方法,其特征在于,在執行步驟S1之前,還包括當PCIe設備發生UCE故障時,會觸發UCE中斷,BIOS單元判斷故障的位置。
8.根據權利要求7所述的一種服務器PCIe設備故障記錄的方法,其特征在于,所述BIOS單元判斷故障的位置的方法為當PCIe鏈路上出現UCE錯誤,系統通過NMI中斷的方式發送Error Message給Root,通知Root發生了System Error;所述NMI中斷中包括PCIE故障的位置信息,所述BIOS接收到所述NMI中斷后,通過NMI中斷向量得出故障位置信息。
9.根據權利要求6所述的一種服務器PCIe設備故障記錄的方法,其特征在于,在步驟S1中,所述當BIOS單元監控到PCIe設備發生UCE故障時,將PCIe設備配置空間寄存器中的AERcapability寄存器收集出來的方法為,在intel的EDS文檔中指明了所述PCIe設備配置空間寄存器的地址,BIOS通過訪問所述PCIe設備配置空間寄存器的地址讀取在CPU單元的PCIe設備配置空間寄存器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州云海信息技術有限公司,未經鄭州云海信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811434099.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:分布式日志系統
- 下一篇:軟件集成測試方法及平臺





