[發(fā)明專利]一種內(nèi)存ECC報(bào)錯(cuò)報(bào)警機(jī)制無效
| 申請(qǐng)?zhí)枺?/td> | 201310018800.1 | 申請(qǐng)日: | 2013-01-18 |
| 公開(公告)號(hào): | CN103092739A | 公開(公告)日: | 2013-05-08 |
| 發(fā)明(設(shè)計(jì))人: | 張燕群;李博樂 | 申請(qǐng)(專利權(quán))人: | 浪潮電子信息產(chǎn)業(yè)股份有限公司 |
| 主分類號(hào): | G06F11/32 | 分類號(hào): | G06F11/32 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250014 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 內(nèi)存 ecc 報(bào)警 機(jī)制 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體的說是一種對(duì)內(nèi)存報(bào)錯(cuò)的風(fēng)險(xiǎn)等級(jí)評(píng)估、方便系統(tǒng)維護(hù)的內(nèi)存ECC報(bào)錯(cuò)報(bào)警機(jī)制。
背景技術(shù)
現(xiàn)行對(duì)內(nèi)存ECC報(bào)錯(cuò)的報(bào)警機(jī)制是不區(qū)分ECC報(bào)錯(cuò)的風(fēng)險(xiǎn)等級(jí),只要出現(xiàn)ECC報(bào)錯(cuò),BMC即刻觸發(fā)報(bào)警,這種狀況下會(huì)給客戶造成不良印象,并增加服務(wù)器的維護(hù)壓力。偶爾發(fā)生的報(bào)錯(cuò),內(nèi)存自身能夠完成糾錯(cuò),對(duì)整個(gè)系統(tǒng)的影響可以忽略不計(jì),針對(duì)這一類的報(bào)錯(cuò),對(duì)整個(gè)系統(tǒng)來說,風(fēng)險(xiǎn)等級(jí)極低,可以不必觸發(fā)報(bào)警;對(duì)在一段時(shí)間內(nèi)大量出現(xiàn)ECC報(bào)錯(cuò)的情況,可能是系統(tǒng)某個(gè)部件已經(jīng)運(yùn)行在高風(fēng)險(xiǎn)狀態(tài),繼續(xù)運(yùn)行可能會(huì)對(duì)系統(tǒng)的穩(wěn)定性影響較大,這種狀態(tài)下及時(shí)觸發(fā)報(bào)警是很有必要的,有助于及時(shí)排除故障,確保系統(tǒng)健康狀態(tài)。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)任務(wù)是解決現(xiàn)有技術(shù)的不足,提供一種對(duì)內(nèi)存報(bào)錯(cuò)的風(fēng)險(xiǎn)等級(jí)評(píng)估的內(nèi)存ECC報(bào)錯(cuò)報(bào)警機(jī)制。
本發(fā)明的技術(shù)方案是按以下方式實(shí)現(xiàn)的,該一種內(nèi)存ECC報(bào)錯(cuò)報(bào)警機(jī)制,包括Intel?Boxboro-EX平臺(tái)服務(wù)器,其具體實(shí)現(xiàn)步驟為:服務(wù)器在高負(fù)載運(yùn)行時(shí),內(nèi)存出現(xiàn)錯(cuò)誤觸發(fā)ECC糾錯(cuò)機(jī)制,通過BIOS設(shè)置一個(gè)計(jì)數(shù)器記錄一定時(shí)間內(nèi)的報(bào)錯(cuò)次數(shù),來評(píng)估報(bào)錯(cuò)時(shí)系統(tǒng)故障的風(fēng)險(xiǎn)等級(jí):低風(fēng)險(xiǎn)等級(jí)時(shí),記錄報(bào)錯(cuò)信息,不觸發(fā)報(bào)警;高風(fēng)險(xiǎn)等級(jí)時(shí),記錄報(bào)錯(cuò)信息的同時(shí),觸發(fā)報(bào)警,提醒用戶及時(shí)維護(hù)系統(tǒng)。
所述通過BIOS評(píng)估報(bào)錯(cuò)時(shí)系統(tǒng)故障風(fēng)險(xiǎn)等級(jí)的詳細(xì)步驟為:BIOS設(shè)置一個(gè)報(bào)錯(cuò)計(jì)數(shù)器,同時(shí)設(shè)置一個(gè)報(bào)錯(cuò)數(shù)量的閥值N,記錄在一個(gè)固定時(shí)間周期T內(nèi)ECC報(bào)錯(cuò)次數(shù),如果在時(shí)間T內(nèi)報(bào)錯(cuò)數(shù)量n未達(dá)到閥值N,即n<N,BIOS通知BMC只如實(shí)記錄報(bào)錯(cuò)信息,并不觸發(fā)報(bào)警;如果在時(shí)間如果在時(shí)間T內(nèi)報(bào)錯(cuò)數(shù)量n超過閥值N,即n≥N,?BIOS會(huì)將報(bào)錯(cuò)信息傳送到BMC,并通知BMC在記錄報(bào)錯(cuò)信息的同時(shí),觸發(fā)報(bào)警提醒用戶系統(tǒng)已經(jīng)出現(xiàn)故障,以便用戶及時(shí)維護(hù)。
所述時(shí)間周期T內(nèi)報(bào)錯(cuò)數(shù)量n未達(dá)到閥值N時(shí),BIOS通知BMC如實(shí)記錄報(bào)錯(cuò)信息后將計(jì)數(shù)器清零并重新開始計(jì)數(shù)。
本發(fā)明與現(xiàn)有技術(shù)相比所產(chǎn)生的有益效果是:
本發(fā)明的一種內(nèi)存ECC報(bào)錯(cuò)報(bào)警機(jī)制通過對(duì)內(nèi)存報(bào)錯(cuò)的風(fēng)險(xiǎn)等級(jí)評(píng)估,對(duì)低風(fēng)險(xiǎn)報(bào)錯(cuò)只做監(jiān)控不做報(bào)警,對(duì)高風(fēng)險(xiǎn)報(bào)錯(cuò)在監(jiān)控同時(shí)觸發(fā)報(bào)警,減少系統(tǒng)的維護(hù)次數(shù),延長系統(tǒng)運(yùn)行周期的,有助于及時(shí)排除故障,確保系統(tǒng)健康狀態(tài)。
附圖說明
附圖1是本發(fā)明的ECC報(bào)警機(jī)制實(shí)現(xiàn)框圖。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明的一種內(nèi)存ECC報(bào)錯(cuò)報(bào)警機(jī)制作以下詳細(xì)說明。
如附圖1所示,現(xiàn)提供一種內(nèi)存ECC報(bào)錯(cuò)報(bào)警機(jī)制,包括Intel?Boxboro-EX平臺(tái)服務(wù)器,其具體實(shí)現(xiàn)步驟為:服務(wù)器在高負(fù)載運(yùn)行時(shí),內(nèi)存出現(xiàn)錯(cuò)誤觸發(fā)ECC糾錯(cuò)機(jī)制,通過BIOS設(shè)置一個(gè)計(jì)數(shù)器記錄一定時(shí)間內(nèi)的報(bào)錯(cuò)次數(shù),來評(píng)估報(bào)錯(cuò)時(shí)系統(tǒng)故障的風(fēng)險(xiǎn)等級(jí):低風(fēng)險(xiǎn)等級(jí)時(shí),記錄報(bào)錯(cuò)信息,不觸發(fā)報(bào)警;高風(fēng)險(xiǎn)等級(jí)時(shí),記錄報(bào)錯(cuò)信息的同時(shí),觸發(fā)報(bào)警,提醒用戶及時(shí)維護(hù)系統(tǒng)。
所述通過BIOS評(píng)估報(bào)錯(cuò)時(shí)系統(tǒng)故障風(fēng)險(xiǎn)等級(jí)的詳細(xì)步驟為:BIOS設(shè)置一個(gè)報(bào)錯(cuò)計(jì)數(shù)器,同時(shí)設(shè)置一個(gè)報(bào)錯(cuò)數(shù)量的閥值N,記錄在一個(gè)固定時(shí)間周期T內(nèi)ECC報(bào)錯(cuò)次數(shù),如果在時(shí)間T內(nèi)報(bào)錯(cuò)數(shù)量n未達(dá)到閥值N,即n<N,這說明ECC報(bào)錯(cuò)只是偶爾發(fā)生,內(nèi)存完全有能力糾錯(cuò),這種狀況下對(duì)系統(tǒng)性能及系統(tǒng)穩(wěn)定性基本沒有影響,風(fēng)險(xiǎn)等級(jí)極低,BIOS只會(huì)將ECC報(bào)錯(cuò)信息發(fā)給BMC,BIOS通知BMC只如實(shí)記錄報(bào)錯(cuò)信息,并不觸發(fā)報(bào)警,BIOS會(huì)將計(jì)數(shù)器清零并重新開始計(jì)數(shù);如果在時(shí)間如果在時(shí)間T內(nèi)報(bào)錯(cuò)數(shù)量n超過閥值N,即n≥N,?這說明在一段時(shí)間內(nèi)內(nèi)存頻繁報(bào)錯(cuò),內(nèi)存能夠完成糾錯(cuò),但是已經(jīng)對(duì)系統(tǒng)性能造成影響,甚至已經(jīng)出發(fā)SDDC或DDDC,或者內(nèi)存模組已經(jīng)出現(xiàn)故障,這種狀況下,系統(tǒng)已經(jīng)工作在異常狀態(tài),或者系統(tǒng)性能已經(jīng)降低,繼續(xù)運(yùn)行可能會(huì)出現(xiàn)死機(jī)或者其他不可預(yù)見的后果,BIOS會(huì)將報(bào)錯(cuò)信息傳送到BMC,并通知BMC在記錄報(bào)錯(cuò)信息的同時(shí),觸發(fā)報(bào)警提醒用戶系統(tǒng)已經(jīng)出現(xiàn)故障,以便用戶及時(shí)維護(hù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮電子信息產(chǎn)業(yè)股份有限公司,未經(jīng)浪潮電子信息產(chǎn)業(yè)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310018800.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種桿塔鳥巢拆除機(jī)械手
- 下一篇:用于拆卸灌流器端帽的工具
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 糾錯(cuò)碼控制器和包括該糾錯(cuò)碼控制器的存儲(chǔ)器系統(tǒng)
- 糾錯(cuò)處理的方法、裝置及固態(tài)硬盤設(shè)備
- 基于數(shù)據(jù)總線的ECC糾錯(cuò)方法及系統(tǒng)
- 存儲(chǔ)器模塊外的ECC輔助存儲(chǔ)器系統(tǒng)
- 存儲(chǔ)器及其操作方法
- 一種動(dòng)態(tài)實(shí)現(xiàn)固態(tài)硬盤ECC校驗(yàn)碼的方法和裝置
- 一種數(shù)據(jù)存儲(chǔ)方法及存儲(chǔ)器
- 用于針對(duì)糾錯(cuò)碼功能的聯(lián)機(jī)功能測(cè)試的系統(tǒng)和方法
- 一種ECC內(nèi)存管理器、方法及電子設(shè)備
- 數(shù)據(jù)存儲(chǔ)、校驗(yàn)方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





