[發(fā)明專利]一種存儲(chǔ)器故障單元的替換方法及裝置、數(shù)據(jù)存儲(chǔ)系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201210509033.X | 申請(qǐng)日: | 2012-12-03 |
| 公開(kāi)(公告)號(hào): | CN103019873A | 公開(kāi)(公告)日: | 2013-04-03 |
| 發(fā)明(設(shè)計(jì))人: | 李延松 | 申請(qǐng)(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號(hào): | G06F11/07 | 分類號(hào): | G06F11/07 |
| 代理公司: | 深圳中一專利商標(biāo)事務(wù)所 44237 | 代理人: | 張全文 |
| 地址: | 518129 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 存儲(chǔ)器 故障 單元 替換 方法 裝置 數(shù)據(jù) 存儲(chǔ)系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)處理領(lǐng)域,尤其涉及一種存儲(chǔ)器故障單元的替換方法及裝置、數(shù)據(jù)存儲(chǔ)系統(tǒng)。
背景技術(shù)
常用的半導(dǎo)體隨機(jī)存取存儲(chǔ)器可以分為動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器DRAM和靜態(tài)隨機(jī)存取存儲(chǔ)器SRAM兩大類,DRAM具有集成度高、速度快等特點(diǎn),主要用作系統(tǒng)的內(nèi)存;SRAM可以達(dá)到更高的速度,不需要定時(shí)刷新,但是集成度較低,因此主要用作高速緩存。
DRAM和SRAM都通過(guò)電荷來(lái)保存信息,例如DRAM是根據(jù)晶體管柵極電容是否存有電荷來(lái)表示1或0,SRAM是根據(jù)晶體管的導(dǎo)通或截止來(lái)表示1或0。它們?cè)谕獠坑钪嫔渚€或芯片封裝材料中放射性元素的影響下,電荷狀態(tài)可能發(fā)生變化,例如從1變成0,導(dǎo)致保存的信息出現(xiàn)變化。這種現(xiàn)象稱為軟失效,但是其中的存儲(chǔ)單元并未損壞,只是信息發(fā)生變化而已,可以通過(guò)重新寫(xiě)入數(shù)據(jù)將其糾正。此外,芯片工作電壓的波動(dòng)、電磁干擾也會(huì)引起軟失效,隨著半導(dǎo)體生產(chǎn)工藝的不斷改進(jìn),DRAM和SRAM的集成度越來(lái)越高,工作電壓也在不斷降低,因此軟失效的幾率在不斷增加。同時(shí),存儲(chǔ)器也會(huì)有個(gè)別存儲(chǔ)單元出現(xiàn)硬失效,這種故障無(wú)法通過(guò)重新寫(xiě)入數(shù)據(jù)進(jìn)行糾正,從該存儲(chǔ)單元中讀出來(lái)的數(shù)據(jù)可能一直是1、一直是0或者不確定。
存儲(chǔ)器中保存的是系統(tǒng)運(yùn)行的代碼和數(shù)據(jù),如果其中的內(nèi)容發(fā)生變化,會(huì)產(chǎn)生意料不到的結(jié)果,甚至可能使得系統(tǒng)運(yùn)行失常或死機(jī)。
為了解決存儲(chǔ)單元的失效問(wèn)題,現(xiàn)有技術(shù)中通過(guò)采用ECC(Error?Check?andCorrection,檢錯(cuò)糾錯(cuò))算法,在現(xiàn)有存儲(chǔ)器的基礎(chǔ)上新增一片校驗(yàn)存儲(chǔ)器(例如內(nèi)存條上有9個(gè)存儲(chǔ)器芯片,其中8個(gè)是數(shù)據(jù)存儲(chǔ)器,1個(gè)是校驗(yàn)存儲(chǔ)器),兩者共用同一個(gè)通道。每次向存儲(chǔ)器寫(xiě)入數(shù)據(jù)時(shí),將根據(jù)ECC算法得到的校驗(yàn)數(shù)據(jù)也一起寫(xiě)入校驗(yàn)存儲(chǔ)器,從存儲(chǔ)器讀出數(shù)據(jù)時(shí),也一起讀出校驗(yàn)存儲(chǔ)器中的數(shù)據(jù),并根據(jù)ECC算法檢測(cè)是否發(fā)生了錯(cuò)誤。如果出現(xiàn)了單比特錯(cuò)誤,ECC算法可以將其糾正,得到正確的數(shù)據(jù)。但ECC算法的糾錯(cuò)能力很有限,一般只能糾正單個(gè)比特的錯(cuò)誤,如果發(fā)生多個(gè)比特錯(cuò)誤將無(wú)法糾正。同時(shí),雖然ECC算法將讀出的單比特錯(cuò)誤糾正了,但存儲(chǔ)器中的內(nèi)容仍然是錯(cuò)誤的,如果此后再發(fā)生一個(gè)比特的失效就無(wú)法糾正了。
為此,現(xiàn)有技術(shù)為了進(jìn)一步提高糾錯(cuò)能力,將兩個(gè)完全相同的存儲(chǔ)器組成鏡像或鎖步方式,使用兩個(gè)通道與存儲(chǔ)控制器連接。其中鏡像方式是將兩個(gè)存儲(chǔ)器的內(nèi)容組成一一對(duì)應(yīng)的關(guān)系,當(dāng)檢測(cè)到其中一個(gè)存儲(chǔ)器的數(shù)據(jù)出錯(cuò)時(shí),再?gòu)牧硪粋€(gè)存儲(chǔ)器取數(shù)據(jù),因此可以容忍整個(gè)存儲(chǔ)器失效;鎖步方式是將兩個(gè)存儲(chǔ)器通道組合成一個(gè)邏輯通道,采用了更先進(jìn)的糾錯(cuò)算法,可以容忍單個(gè)存儲(chǔ)器芯片失效。但是顯然,所述鏡像方式和鎖步方式都要求使用兩組容量、速度完全一樣的存儲(chǔ)器,增加了系統(tǒng)成本和功耗。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,本發(fā)明提供一種存儲(chǔ)器故障單元的替換方法及裝置和數(shù)據(jù)存儲(chǔ)系統(tǒng),旨在解決現(xiàn)有技術(shù)中,通過(guò)增加校驗(yàn)存儲(chǔ)器,采用ECC算法的糾錯(cuò)能力很有限,以及采用鏡像方式或鎖步方式增加了系統(tǒng)成本和功耗的技術(shù)問(wèn)題。
第一方面,所述存儲(chǔ)器故障單元的替換方法包括:根據(jù)讀取地址讀取主存儲(chǔ)器中對(duì)應(yīng)數(shù)據(jù);檢測(cè)所述數(shù)據(jù)是否正確;若所述數(shù)據(jù)錯(cuò)誤,則在映射表中查找所述讀取地址對(duì)應(yīng)的替換地址,從替換存儲(chǔ)器中獲取所述替換地址對(duì)應(yīng)的替換數(shù)據(jù)并返回至處理器,其中所述映射表保存有主存儲(chǔ)器中故障單元地址和替換存儲(chǔ)器中對(duì)應(yīng)替換地址的映射關(guān)系,所述替換存儲(chǔ)器用于保存主存儲(chǔ)器中故障單元所對(duì)應(yīng)的正確數(shù)據(jù);若所述數(shù)據(jù)正確,則將所述數(shù)據(jù)直接返回至處理器。
在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述根據(jù)讀取地址讀取主存儲(chǔ)器中對(duì)應(yīng)數(shù)據(jù),并檢測(cè)所述數(shù)據(jù)是否正確步驟之前,還包括:根據(jù)寫(xiě)入地址將數(shù)據(jù)寫(xiě)入主存儲(chǔ)器中對(duì)應(yīng)的存儲(chǔ)單元,若映射表中存在所述寫(xiě)入地址,將所述數(shù)據(jù)同時(shí)替換存儲(chǔ)器中對(duì)應(yīng)的存儲(chǔ)單元。
結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,若所述數(shù)據(jù)錯(cuò)誤,則在映射表中查找所述讀取地址對(duì)應(yīng)的替換地址,從替換存儲(chǔ)器中獲取所述替換地址對(duì)應(yīng)的替換數(shù)據(jù)并返回至處理器步驟,具體包括:若所述數(shù)據(jù)錯(cuò)誤且無(wú)法糾正,則在映射表中查找所述讀取地址對(duì)應(yīng)的替換地址,從替換存儲(chǔ)器中獲取所述替換地址對(duì)應(yīng)的替換數(shù)據(jù)并返回至處理器。
結(jié)合第一方面第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,若所述數(shù)據(jù)錯(cuò)誤但可以糾正,則將糾正后的數(shù)據(jù)返回至處理器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210509033.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 用于控制非易失性存儲(chǔ)器的控制器
- 處理器、存儲(chǔ)器、計(jì)算機(jī)系統(tǒng)、系統(tǒng)LSI及其驗(yàn)證方法
- 存儲(chǔ)和檢索處理系統(tǒng)的數(shù)據(jù)的存儲(chǔ)器系統(tǒng)和性能監(jiān)視方法
- 用于控制半導(dǎo)體裝置的方法
- 存儲(chǔ)器存儲(chǔ)裝置及其測(cè)試方法
- 存儲(chǔ)器裝置及可促進(jìn)張量存儲(chǔ)器存取的方法
- 使用雙通道存儲(chǔ)器作為具有間隔的單通道存儲(chǔ)器
- 用于管理存儲(chǔ)器訪問(wèn)操作的方法和系統(tǒng)
- 存儲(chǔ)器控制器、存儲(chǔ)裝置和存儲(chǔ)裝置的操作方法
- 具有部分組刷新的存儲(chǔ)器
- 故障檢測(cè)裝置、故障檢測(cè)方法以及故障檢測(cè)程序
- 故障預(yù)測(cè)裝置、故障預(yù)測(cè)方法及故障預(yù)測(cè)程序
- 故障分析裝置、故障分析系統(tǒng)及故障分析方法
- 故障檢測(cè)方法、故障檢測(cè)裝置和故障檢測(cè)系統(tǒng)
- 故障檢測(cè)裝置、故障檢測(cè)方法及計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)
- 故障檢測(cè)裝置、故障檢測(cè)方法和計(jì)算機(jī)能讀取的存儲(chǔ)介質(zhì)
- 故障檢測(cè)裝置、故障檢測(cè)系統(tǒng)、故障檢測(cè)方法
- 故障處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 故障排除方法、故障排除裝置及故障排除系統(tǒng)
- 故障檢測(cè)電路、故障檢測(cè)系統(tǒng)及故障檢測(cè)方法





