[發(fā)明專利]一種內(nèi)存可糾正錯誤處理方法、系統(tǒng)、設(shè)備以及介質(zhì)在審
| 申請?zhí)枺?/td> | 202011404825.1 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112463492A | 公開(公告)日: | 2021-03-09 |
| 發(fā)明(設(shè)計(jì))人: | 羅鵬芳;張春宏;陳思彤 | 申請(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F11/22 | 分類號: | G06F11/22;G06Q10/10 |
| 代理公司: | 北京連和連知識產(chǎn)權(quán)代理有限公司 11278 | 代理人: | 劉小峰;陳黎明 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 內(nèi)存 糾正 錯誤 處理 方法 系統(tǒng) 設(shè)備 以及 介質(zhì) | ||
本發(fā)明公開了一種內(nèi)存可糾正錯誤處理方法,包括以下步驟:接收對BIOS中預(yù)先定義的可糾正錯誤處理配置項(xiàng)進(jìn)行設(shè)置的指令并進(jìn)行相應(yīng)設(shè)置;響應(yīng)于所述BIOS啟動,獲取BIOS中設(shè)置的所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值;根據(jù)所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值選擇執(zhí)行相應(yīng)的處理內(nèi)存可糾正錯誤的方法。本發(fā)明還公開了一種系統(tǒng)、計(jì)算機(jī)設(shè)備以及可讀存儲介質(zhì)。本發(fā)明提供的方案通過設(shè)置不同的可糾正錯誤(例如UPI錯誤、PCIE錯誤、ECC錯誤)的處理策略,可以實(shí)現(xiàn)服務(wù)器在不用業(yè)務(wù)場景的切換,滿足不同用戶的多樣性需求,兼容錯誤抑制、錯誤數(shù)據(jù)收集的需求。根據(jù)不同用戶定制不同的處理策略,快速輸出定制化方案。
技術(shù)領(lǐng)域
本發(fā)明涉及服務(wù)器領(lǐng)域,具體涉及一種內(nèi)存可糾正錯誤處理方法、系統(tǒng)、設(shè)備以及存儲介質(zhì)。
背景技術(shù)
發(fā)生內(nèi)存故障的概率也越高,當(dāng)發(fā)生內(nèi)存可糾正錯誤時(shí)需要將錯誤記錄下來,同時(shí)還要考慮錯誤發(fā)生的次數(shù),當(dāng)短時(shí)間出錯次數(shù)較高時(shí),日志如何記錄需要根據(jù)不同業(yè)務(wù)決定,提供不同內(nèi)存錯誤的告警策略可以滿足不同業(yè)務(wù)的可糾正錯誤告警需求應(yīng)用業(yè)務(wù)不同,可糾正錯誤日志上報(bào)也會不一樣,現(xiàn)有的可糾正處理方式,在不同的應(yīng)用場景下各有不足,如內(nèi)存可糾正風(fēng)暴的影響,或者將控制可糾正報(bào)錯的規(guī)則放到SMI中斷處理,從而使SMI處理時(shí)間延長,或僅將可糾正報(bào)錯的規(guī)則放到BMC處理,未考慮可糾正錯誤風(fēng)暴帶來的SMI中斷影響OS下的性能。
發(fā)明內(nèi)容
有鑒于此,為了克服上述問題的至少一個方面,本發(fā)明實(shí)施例提出一種內(nèi)存可糾正錯誤處理方法,包括以下步驟:
接收對BIOS中預(yù)先定義的可糾正錯誤處理配置項(xiàng)進(jìn)行設(shè)置的指令并進(jìn)行相應(yīng)設(shè)置;
響應(yīng)于所述BIOS啟動,獲取BIOS中設(shè)置的所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值;
根據(jù)所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值選擇執(zhí)行相應(yīng)的處理內(nèi)存可糾正錯誤的方法。
在一些實(shí)施例中,根據(jù)所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值選擇執(zhí)行相應(yīng)的處理內(nèi)存可糾正錯誤的方法,進(jìn)一步包括:
響應(yīng)于所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值為第一預(yù)設(shè)值,所述BIOS接收并處理CPU因檢測到所述內(nèi)存可糾正錯誤而產(chǎn)生的SMI中斷事件。
在一些實(shí)施例中,根據(jù)所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值選擇執(zhí)行相應(yīng)的處理內(nèi)存可糾正錯誤的方法,進(jìn)一步包括:
響應(yīng)于所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值為第二預(yù)設(shè)值且所述BIOS在預(yù)設(shè)時(shí)間段內(nèi)接收到的SMI中斷事件的次數(shù)達(dá)到閾值,關(guān)閉所述CPU上對應(yīng)的寄存器,以關(guān)閉內(nèi)存的可糾正計(jì)數(shù)功能。
在一些實(shí)施例中,根據(jù)所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值選擇執(zhí)行相應(yīng)的處理內(nèi)存可糾正錯誤的方法,進(jìn)一步包括:
響應(yīng)于所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值為第三預(yù)設(shè)值且BMC在預(yù)設(shè)時(shí)間段內(nèi)接收到的SMI中斷事件的次數(shù)達(dá)到閾值,關(guān)閉所述CPU上對應(yīng)的寄存器,以關(guān)閉內(nèi)存的可糾正計(jì)數(shù)功能。
在一些實(shí)施例中,還包括:
響應(yīng)于通過帶外命令接收到對所述可糾正錯誤處理配置項(xiàng)進(jìn)行更改的指令,重啟所述BIOS以從BMC中獲取到更改后的可糾正錯誤處理配置項(xiàng)的值,并利用所述更改后的可糾正錯誤處理配置項(xiàng)的值選擇執(zhí)行相應(yīng)的處理內(nèi)存可糾正錯誤的方法。
基于同一發(fā)明構(gòu)思,根據(jù)本發(fā)明的另一個方面,本發(fā)明的實(shí)施例還提供了一種內(nèi)存可糾正錯誤處理系統(tǒng),包括:
設(shè)置模塊,所述設(shè)置模塊配置為接收對BIOS中預(yù)先定義的可糾正錯誤處理配置項(xiàng)進(jìn)行設(shè)置的指令并進(jìn)行相應(yīng)設(shè)置;
獲取模塊,所述獲取模塊配置為響應(yīng)于所述BIOS啟動,獲取BIOS中設(shè)置的所述可糾正錯誤處理配置項(xiàng)對應(yīng)的值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011404825.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:云計(jì)算的AI數(shù)據(jù)調(diào)度分配方法及相關(guān)產(chǎn)品
- 下一篇:一種深度學(xué)習(xí)模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)
- 同類專利
- 專利分類





