[發明專利]在系統中的錯誤處置設備中記錄錯誤在審
| 申請號: | 201811364902.8 | 申請日: | 2018-11-16 |
| 公開(公告)號: | CN109933449A | 公開(公告)日: | 2019-06-25 |
| 發明(設計)人: | S·拉達克里希南;M·特里維迪;J·托利伊爾;E·A·麥克沙恩;R·W·劉;M·S·納圖 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 劉瑜;王英 |
| 地址: | 美國加*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 錯誤處置 錯誤消息 錯誤寄存器 關聯 計算系統 設備記錄 設備接收 設備提供 記錄 傳送 發送 | ||
錯誤處置設備記錄包括連接到錯誤處置設備的多個設備的計算系統中的錯誤。錯誤處置設備提供錯誤寄存器組。每個錯誤寄存器組與多個值中的值相關聯。將錯誤傳送到錯誤處置設備的設備中的每個設備與值中的一個值相關聯。錯誤處置設備從連接到錯誤處置設備的設備接收錯誤消息,并且針對接收到的錯誤消息中的每個接收到的錯誤消息,確定多個值中的與發送接收到的錯誤消息的設備相關聯的值,確定與所確定的值相關聯的錯誤寄存器組,并且將接收到的錯誤消息記錄在所確定的錯誤寄存器組中。
技術領域
本文描述的實施例總體上涉及在系統中的錯誤處置設備中記錄錯誤。
背景技術
系統(例如,片上系統(SOC))提供對來自連接設備的錯誤的記錄和處置。在連接到SOC的設備處并且在SOC內不同通信層處的分組傳輸中可能發生錯誤,例如,事務層錯誤、數據鏈路層錯誤、物理層錯誤。錯誤可以被分類為由硬件處置的可糾正錯誤以及由設備特定軟件和系統軟件處置的不可糾正錯誤,例如,致命錯誤和非致命錯誤。系統設計中的可靠性、可用性和可維護性(RAS)要求包括錯誤收集,即記錄和報告錯誤。需要錯誤報告來執行平臺診斷,以便如果災難性錯誤變為強制性的,則識別服務器系統在現場(原位地和遠程地)停機的原因,進行崩潰數據收集以及FRU(現場可更換單元)隔離。由于意外的全局功率周期和非預期的熱重置事件可能阻礙在可能使系統凍結或受到網絡攻擊的災難性錯誤之后讀取錯誤數據的能力,因此在重置之前和之后新的錯誤收集方案是必不可少的,以便系統管理程序快速調試并且通過將故障原因隔離并本地化到平臺、SOC或芯片組內的各種功能塊(IP)內來減少宕機時間。
用于Intel服務器的服務器錯誤報告方案由全局集成錯誤處置器(GIEH)構成,該GIEH與分布在片上系統(例如,SOC封裝的北復合體和南復合體)中的平臺控制器中心(PCH)中的多個衛星集成錯誤處置器(SIEH)耦合。對于例如與基于Intel AtomTM的單片管芯一起使用的u-server錯誤架構,SOC具有連接到產生錯誤的各種錯誤源的單個GIEH。在客戶端系統的情況下,SOC依賴于中斷定時器子系統(ITSS)IP來進行錯誤記錄方案和報告,其為PCH提供一個錯誤記錄位。
附圖說明
參考附圖,通過示例的方式描述了實施例,附圖未按比例繪制,其中相同的附圖標記指代相似的元素。
圖1示出了實施例在其中實現的系統。
圖2示出了錯誤處置設備的實施例。
圖3示出了錯誤消息的實施例。
圖4示出了全局/本地錯誤寄存器組的實施例。
圖5示出了系統事件控制寄存器條目的實施例。
圖6示出了錯誤處置邏輯的實施例。
圖7示出了用于對接收到的錯誤消息進行處理的錯誤處置邏輯的實施例。
圖8示出了用于對全局錯誤寄存器中的記錄的錯誤進行檢測的錯誤處置邏輯的實施例。
圖9示出了用于對來自另一錯誤處置設備的錯誤消息進行處理的錯誤處置邏輯的實施例。
圖10示出了圖1的系統可以在其中部署的系統。
具體實施方式
所描述的實施例提供平臺控制器中心(PCH)中的錯誤處置,PCH部署多個錯誤處置設備以收集錯誤并將錯誤傳播到全局錯誤處置設備,以適應其中將部署錯誤處置實施例的、從服務器到客戶端的各種類型的系統。所描述的實施例提供了廣泛的錯誤記錄和報告能力以供軟件使用,以與其他早期實現方式相比以及時地方式快速調試和隔離故障單元。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811364902.8/2.html,轉載請聲明來源鉆瓜專利網。





