[發(fā)明專利]一種內(nèi)存故障處理方法、裝置及計算機可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210362920.2 | 申請日: | 2022-04-08 |
| 公開(公告)號: | CN114461436A | 公開(公告)日: | 2022-05-10 |
| 發(fā)明(設(shè)計)人: | 張玉峰 | 申請(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 魯梅 |
| 地址: | 215100 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 內(nèi)存 故障 處理 方法 裝置 計算機 可讀 存儲 介質(zhì) | ||
本申請公開了一種內(nèi)存故障處理方法、裝置及計算機可讀存儲介質(zhì),涉及計算機技術(shù)領(lǐng)域。通過監(jiān)測服務(wù)器的內(nèi)存的故障信息,獲取內(nèi)存的冗余空間,判斷冗余空間是否小于第一閾值;若否,根據(jù)故障信息獲取故障物理內(nèi)存地址及其對應(yīng)的虛擬內(nèi)存地址;通過內(nèi)存的冗余機制將故障物理內(nèi)存地址隔離,并獲取新的物理內(nèi)存地址;將故障物理內(nèi)存地址中的數(shù)據(jù)備份,映射虛擬內(nèi)存地址至新的物理內(nèi)存地址,以用于將數(shù)據(jù)遷移至新的物理內(nèi)存地址。因此,方案通過冗余機制將故障內(nèi)存永久隔離,同時改變虛擬內(nèi)存映射位置將故障內(nèi)存在軟件層面隔離,不丟失故障內(nèi)存中的數(shù)據(jù);有效降低了內(nèi)存故障導(dǎo)致的宕機率,減少了不必要的內(nèi)存更換,降低了運維成本。
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,特別是涉及一種內(nèi)存故障處理方法、裝置及計算機可讀存儲介質(zhì)。
背景技術(shù)
服務(wù)器內(nèi)存也是內(nèi)存(RAM),具有一些特有的技術(shù),例如錯誤檢查和糾正(ErrorCorrecting Code,ECC)等,從而有著極高的穩(wěn)定性和糾錯性能。而當(dāng)前所有現(xiàn)代操作系統(tǒng)對于服務(wù)器內(nèi)存的訪問,并不是直接訪問物理內(nèi)存的,而是通過一個中間層,這個中間層在操作系統(tǒng)中被稱為虛擬內(nèi)存(Virtual Memory,VM);操作系統(tǒng)通過VM,去訪問VM映射的對應(yīng)的物理內(nèi)存。同時也可以改變虛擬內(nèi)存映射的物理內(nèi)存地址,從而使操作系統(tǒng)訪問該物理內(nèi)存地址。
但是,在服務(wù)器的運行使用中,服務(wù)器硬件故障診斷和故障預(yù)測是服務(wù)器運行維護領(lǐng)域的痛點也是技術(shù)難點。其中由內(nèi)存引起的服務(wù)器故障是所有故障中占比最高的,因此如果能夠有效診斷服務(wù)器內(nèi)存故障,并且對故障進行技術(shù)隔離,便可以有效降低服務(wù)器故障。
鑒于上述問題,設(shè)計一種可靠的內(nèi)存故障處理方法,是該領(lǐng)域技術(shù)人員亟待解決的問題。
發(fā)明內(nèi)容
本申請的目的是提供一種內(nèi)存故障處理方法、裝置及計算機可讀存儲介質(zhì)。
為解決上述技術(shù)問題,本申請?zhí)峁┮环N內(nèi)存故障處理方法,包括:
監(jiān)測服務(wù)器的內(nèi)存的故障信息,以確認所述內(nèi)存發(fā)生故障;
獲取所述內(nèi)存的冗余空間;
判斷所述冗余空間是否小于第一閾值;
若否,根據(jù)所述故障信息獲取故障物理內(nèi)存地址及其對應(yīng)的虛擬內(nèi)存地址;
通過所述內(nèi)存的冗余機制將所述故障物理內(nèi)存地址隔離,并獲取新的物理內(nèi)存地址;其中,所述新的物理內(nèi)存地址的空間與所述故障物理內(nèi)存地址的空間大小相等;
將所述虛擬內(nèi)存地址對應(yīng)的所述故障物理內(nèi)存地址中的數(shù)據(jù)備份;
映射所述虛擬內(nèi)存地址至所述新的物理內(nèi)存地址,以用于將所述數(shù)據(jù)遷移至所述新的物理內(nèi)存地址。
優(yōu)選地,所述監(jiān)測服務(wù)器的內(nèi)存的故障信息包括:
通過MCA技術(shù)監(jiān)測所述內(nèi)存的所述故障信息,將所述故障信息記錄在中斷屏蔽控制寄存器中,并生成故障日志。
優(yōu)選地,所述監(jiān)測服務(wù)器的內(nèi)存的故障信息包括:
判斷所述故障信息的數(shù)量在第一預(yù)設(shè)時間內(nèi)是否大于第二閾值;其中,所述故障信息的數(shù)量以第二預(yù)設(shè)時間為周期遞減,所述第二預(yù)設(shè)時間小于所述第一預(yù)設(shè)時間;
若是,則確認所述內(nèi)存發(fā)生故障,進入到所述獲取所述內(nèi)存的冗余空間的步驟。
優(yōu)選地,所述根據(jù)所述故障信息獲取故障物理內(nèi)存地址及其對應(yīng)的虛擬內(nèi)存地址包括:
解析所述中斷屏蔽控制寄存器以獲取到所述故障物理內(nèi)存地址;
根據(jù)所述故障日志通過內(nèi)存管理單元獲取所述故障物理內(nèi)存地址對應(yīng)的所述虛擬內(nèi)存地址。
優(yōu)選地,在所述映射所述虛擬內(nèi)存地址至所述新的物理內(nèi)存地址之后,還包括:
標(biāo)記所述故障物理內(nèi)存地址。
優(yōu)選地,在所述標(biāo)記所述故障物理內(nèi)存地址之后,還包括:
觸發(fā)內(nèi)存故障告警。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210362920.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





