[發明專利]內存故障分析方法及計算機設備有效
| 申請號: | 202211312307.6 | 申請日: | 2022-10-25 |
| 公開(公告)號: | CN115686901B | 公開(公告)日: | 2023-08-04 |
| 發明(設計)人: | 曹瑞;張光彪;甘延;鮑全洋 | 申請(專利權)人: | 超聚變數字技術有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 劉春麗 |
| 地址: | 450046 河南省鄭州市鄭*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 內存 故障 分析 方法 計算機 設備 | ||
本申請提供了一種內存故障分析方法及計算機設備,涉及內存技術領域。該方法中,基于內存發生故障的第一物理位置,確定內存的第一物理區域存在第一故障類型,在確定發生故障的第二物理位置后,基于發生故障的第二物理位置和至少一個第一物理位置,確定內存的第二物理區域存在第二故障類型。若第二物理區域包括第一物理區域上的每個第一物理位置、且第一物理區域不包括第二物理位置,則取消第一故障類型,確定內存僅包括第二故障類型,實現了動態確定內存的故障類型,使內存的故障類型隨著故障的不斷發生而動態變化,有助于減少內存所存在的故障類型,進而縮小內存的待修復區域,而在進行內存修復時,有助于減少內存上被隔離的物理區域。
技術領域
本申請涉及內存技術領域,尤其涉及一種內存故障分析方法及計算機設備。
背景技術
內存是計算機設備中必不可少的一個部件,在使用過程中有一定概率會出現內存故障。內存故障包括可糾正(corrected?error,CE)級別故障和不可糾正(uncorrectederror,UCE)級別故障。其中,CE級別故障可以自動修復,UCE級別故障無法自動修復,且通常會導致計算機設備的系統宕機。
由于內存發生多個故障后,內存上的部分物理區域會呈現出現行故障、列故障或存儲陣列故障等故障類型。相關技術中,為了降低UCE級別故障導致系統宕機的概率,會對內存存在的故障類型進行分析,若基于當前發生故障確定內存的一個物理區域存在一個故障類型(如列故障),便會對內存上的一個物理區域進行隔離修復。之后,內存發生新故障,若基于新故障確定內存的另一個物理區域存在另一個故障類型(如行故障),則對內存上的另一個物理區域進行隔離修復。這就導致內存的可用存儲空間越來越小,嚴重影響了內存的存儲性能。
發明內容
本申請實施例提供一種內存故障分析方法及計算機設備,能夠動態確定內存存在的故障類型進行,有助于減少內存上被隔離的物理區域,提高內存的存儲性能。
為達到上述目的,本申請的實施例采用如下技術方案:
第一方面,提供了一種內存故障分析方法,用于計算機設備,該計算機設備包括中央處理器CPU和帶外控制器,該方法由帶外控制器執行;該方法包括:若內存發生故障的多個第一物理位置所在的第一物理區域滿足第一預設條件,確定內存的第一物理區域存在第一故障類型;第一故障類型指示了內存的待修復區域包括第一物理區域;若內存發生故障的目標物理位置所在的第二物理區域滿足第二預設條件,確定內存的第二物理區域存在第二故障類型;第二故障類型指示了內存的待修復區域包括第二物理區域,目標物理位置包括第二物理位置和至少一個第一物理位置,第二物理位置發生故障的時刻晚于每個第一物理位置發生故障的時刻;若第二物理區域包括第一物理區域上的每個第一物理位置、且第一物理區域未包括第二物理位置,確定內存的故障類型包括第二故障類型、且不包括第一故障類型。
該方案中,基于內存發生故障的多個第一物理位置,確定內存的第一物理區域存在第一故障類型后,若確定內存發生故障的第二物理位置,則基于內存發生故障的目標物理位置,確定內存的第二物理區域存在第二故障類型,該目標物理位置包括第二物理位置和至少一個第一物理位置。在此基礎上,若第二物理區域包括第一物理區域上的每個第一物理位置、且第一物理區域未包括第二物理位置,則取消內存的第一物理區域存在的第一故障類型,確定內存的故障類型僅包括第二物理區域上的第二故障類型,實現了動態確定內存的故障類型,這樣,內存的故障類型會隨著故障的不斷發生而動態變化,一方面,能夠使得內存的當前故障類型更加準確的表現故障位置的分布特性,另一方面,通過取消故障位置被覆蓋的故障類型,能夠在所修復的發生故障的物理位置的數量不變的基礎上,縮小內存的待修復區域。
相對于相關技術中的方案,基于該實施例所確定內存的故障類型進行故障修復時,有助于減少內存上被隔離的物理區域,提高內存的存儲性能。另外,由于基于第二物理位置確定內存的故障類型時,結合了之前發生故障的多個第一物理位置,因此,可以更全面的分析內存上發生故障的物理位置的規律,有助于提高所確定的故障類型的準確性,進而為后續對內存進行修復時提供精準的待修復區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于超聚變數字技術有限公司,未經超聚變數字技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211312307.6/2.html,轉載請聲明來源鉆瓜專利網。





