[發明專利]一種基于Redhat系統下內存錯誤檢測方法在審
| 申請號: | 201610199778.9 | 申請日: | 2016-04-01 |
| 公開(公告)號: | CN105786668A | 公開(公告)日: | 2016-07-20 |
| 發明(設計)人: | 李萌 | 申請(專利權)人: | 浪潮電子信息產業股份有限公司 |
| 主分類號: | G06F11/26 | 分類號: | G06F11/26;G06F11/34 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250101 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 redhat 系統 內存 錯誤 檢測 方法 | ||
技術領域
本發明公開一種基于Redhat系統下內存錯誤檢測方法,屬于系統內存測試領域。
背景技術
隨著人們對網絡安全的逐漸重視,國內服務器迎來了快速發展的機遇,發展到現 在,服務器已經經過了幾代的升級,每一次升級都會伴隨著硬件配置不斷提高,性能也成倍 的增長。現在比較高端的服務器,已經開始支持高達12T的內存,由于硬件與軟件支持的內 存越來越多,相應的對服務器的穩定性要求也越來越高。
服務器的穩定性,很大一部分取決于內存的穩定性,內存作為計算機系統下反復 高速讀取的部件,在硬件設計以及環境因素等條件下,很容易出現報錯,其中主要報錯有兩 種,一種為uncorrectablememoryerror,這種報錯為系統不可糾正報錯,若出現這種報 錯,一般會導致系統出現嚴重問題,一種是correctablememoryerror,這種錯誤比較常 見,服務器中內存出現這種報錯,則會由BIOS將報錯信息發給系統,系統會在日志中進行記 錄,相關報錯會記錄在mcelog中,但是BIOS中會設置閾值,極少量的correctablememory error不會影響系統正常運行,并且由于服務器所使用的內存支持糾錯功能,BIOS不會發送 給系統,只是在相應寄存器下記錄該錯誤數量,當出現大量的報錯,達到BIOS中所設置的閾 值,才會觸發BIOS發送給系統,但有時少量correctablememoryerror錯誤也能引起系統 故障,且未被報送的correctablememoryerror錯誤不利于系統外部環境方面分析導致內 存報錯原因。本發明提供一種基于Redhat系統下內存錯誤檢測方法,針對于correctable memoryerror的檢測,通過msr-tool工具,實現自定義時間間隔讀取寄存器信息,達到檢測 內存報錯的目的,可以在BIOS未將報錯發送給系統,讀取到錯誤,使測試更準確,并且腳本 能夠在每隔一段時間進行抓取log,通過查看log,可以得到內存出現報錯的準確時間,用于 從環境等其他方面分析報錯,簡單實用。
發明內容
本發明提供一種基于Redhat系統下內存錯誤檢測方法,通過抓取寄存器信息來判 斷內存是否報錯,相對于從系統下查看log來判定內存報錯,更精確,并且通過實時抓取log 信息,有利于從電壓,溫度等其他外部環境方面分析導致內存報錯原因。
本發明提出的具體方案是:
一種基于Redhat系統下內存錯誤檢測方法,對測試服務器在Redhat系統下進行內存壓 力測試,讀取CPU寄存器值,確定每顆cpu下所使用的相關寄存器的值,將寄存器的值記錄到 日志文件夾下,查看寄存器的值是否為0,是則表示內存沒有出現報錯,否則表示內存出現 報錯;具體步驟為:
對測試的服務器,安裝Redhat操作系統;
進入操作系統,使用root用戶登錄;
將meminfo文件夾拷貝到/root/文件夾下,打開終端,將執行指令添加到/etc/crontab 文件中;
重新啟動crond服務;
對系統下內存進行壓力測試;
切換到相應日期下的文件夾下進行日志查看,寄存器的值是否為0,是則表示內存沒有 出現報錯,否則表示內存出現報錯。
Redhat系統調用msr-tool工具讀取CPU寄存器值。
Redhat系統調用msr-tool工具,進行寄存器讀取,壓力測試腳本通過抓取/proc/ cpuinfo文件下的physicalid,確定CPU數量,通過msr-tool分別讀取每顆cpu下所使用的 相關寄存器的值。
重新啟動crond服務,每隔一定時間執行一次寄存器值的抓取,通過查看日志信 息,確定錯誤發生的時間。
本發明的有益之處是:
本發明提供一種基于Redhat系統下內存錯誤檢測方法,針對于correctablememory error的檢測,通過msr-tool工具,實現自定義時間間隔讀取寄存器信息,達到檢測內存報 錯的目的,可以在BIOS未將報錯發送給系統,讀取到錯誤,使測試更準確,并且腳本能夠在 每隔一段時間進行抓取log,通過查看log,可以得到內存出現報錯的準確時間,用于從環境 等其他方面分析報錯,簡單實用。
附圖說明
圖1本發明測試流程示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮電子信息產業股份有限公司,未經浪潮電子信息產業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610199778.9/2.html,轉載請聲明來源鉆瓜專利網。





