[發明專利]一種內存故障自動定位方法及裝置有效
| 申請號: | 201310095239.7 | 申請日: | 2013-03-22 |
| 公開(公告)號: | CN103197999A | 公開(公告)日: | 2013-07-10 |
| 發明(設計)人: | 黎世勇;王雁鵬;王曉靜;魏偉 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F11/22 | 分類號: | G06F11/22 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 內存 故障 自動 定位 方法 裝置 | ||
技術領域
本發明涉及信息存儲技術領域,特別涉及一種內存故障自動定位方法及裝置。?
背景技術
在Intel?CPU中提供了一種MCA(Machine?Check?Architecture,機器檢查架構),Nehalm平臺的MCA會在寄存器中記錄故障內存的槽位信息,應用程序通過讀取寄存器中的值就可以定位到故障內存。?
但是一旦Sandybridge平臺MCA架構發生了變化,寄存器中不再直接記錄故障內存的槽位信息,因此采用以往的檢測方法不能確定故障內存的槽位。?
發明內容
本發明旨在至少解決上述技術問題之一。?
為此,本發明的一個目的在于提出一種能夠精確的定位出故障內存槽位,并對其進行維修,從而提高內存故障監控率,也減輕數據中心運維成本的內存故障自動定位方法。?
本發明的另一目的在于提出一種內存故障自動定位裝置。?
為了實現上述目的,本發明第一方面的實施例提出了一種內存故障自動定位方法,包括如下步驟:讀取機器檢查架構MCA寄存器的值,并對所述寄存器的值進行解析以獲取故障內存的物理地址;根據所述故障內存的物理地址獲?取所述內存在套接字socket之間的交錯狀態,并根據所述內存在套接字socket之間的交錯狀態獲取所述故障內存所在的socket值;根據所述內存故障物理地址和所述內存在套接字socket之間的交錯狀態獲取所述故障內存所在的通道值和通道內偏移;根據所述故障內存所在的通道內偏移獲取所述故障內存的槽位信息;以及根據所述故障內存所在的socket值、所述通道值和所述槽位信息對所述故障內存進行定位。?
根據本發明實施例的內存故障自動定位方法,在Sandybridge平臺下,通過MCA寄存器中故障內存的物理地址,能夠精確的定位出故障內存槽位,并配合其他方法對故障內存進行修復,從而提高了內存故障監控率,同時也減輕了數據中心的運維成本。?
另外,根據本發明上述實施例的內存故障自動定位方法還可以具有如下附加的技術特征:?
在本發明的實施例中,所述故障內存的物理地址包括:64個字節對齊、第一套接字socket交錯、通道交錯、行列交錯、第二套接字socket交錯。?
在本發明的實施例中,所述根據所述故障內存所在的通道內偏移獲取所述故障內存的槽位信息,包括如下步驟:利用所述故障內存所在的通道內偏移獲取所述故障內存所對應的socket內的行值;根據所述行值以及所述內存的行與槽位的對應關系,獲得所述故障內存的槽位信息。?
在本發明的實施例中,所述通道內偏移為所述故障內存所在的通道對應所在socket的通道0的偏移地址。?
本發明第二方面的實施例還提出了一種內存故障自動定位裝置,包括:讀取模塊,用于讀取機器檢查構架MCA寄存器的值,并對所述寄存器的值進行解析以獲取故障內存的物理地址;socket值獲取模塊,所述socket值獲取模塊?與所述讀取模塊相連,用于根據所述故障內存的物理地址獲取所述內存在套接字socket之間的交錯狀態,并根據所述內存在套接字socket之間的交錯狀態獲取所述故障內存所在的socket值;通道信息獲取模塊,所述通道信息獲取模塊與所述讀取模塊和所述socket值獲取模塊相連,用于根據所述內存故障物理地址和所述內存在套接字socket之間的交錯狀態獲取所述故障內存所在的通道值和通道內偏移;槽位信息獲取模塊,所述槽位信息獲取模塊與所述通道信息獲取模塊相連,用于根據所述故障內存所在的通道內偏移獲取所述故障內存的槽位信息;以及定位模塊,所述定位模塊與所述socket值獲取模塊、所述通道信息獲取模塊和所述槽位信息獲取模塊相連,用于根據所述故障內存所在的socket值、所述通道值和所述槽位信息對所述故障內存進行定位。?
根據本發明實施例的內存故障自動定位裝置,在Sandybridge平臺下,通過MCA寄存器中故障內存的物理地址,能夠精確的定位出故障內存槽位,并配合其他方法對故障內存進行修復,從而提高了內存故障監控率,同時也減輕了數據中心的運維成本。?
另外,根據本發明上述實施例的內存故障自動定位裝置還可以具有如下附加的技術特征:在本發明的實施例中,所述故障內存的物理地址包括:64個字節對齊、第一套接字socket交錯、通道交錯、行列交錯、第二套接字socket交錯。?
在本發明的實施例中,所述槽位信息獲取模塊利用所述故障內存所在的通道內偏移獲取所述故障內存所對應的socket內的行值,并根據所述行值以及所述內存的行與槽位的對應關系,獲得所述故障內存的槽位信息。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310095239.7/2.html,轉載請聲明來源鉆瓜專利網。





