[發明專利]鏡像數據存儲系統中的增強錯誤檢測有效
| 申請號: | 201110352224.5 | 申請日: | 2011-11-09 |
| 公開(公告)號: | CN102708021A | 公開(公告)日: | 2012-10-03 |
| 發明(設計)人: | D·A·吉爾伯特 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F11/08 | 分類號: | G06F11/08 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 金曉 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 存儲系統 中的 增強 錯誤 檢測 | ||
技術領域
本發明涉及的領域是鏡像數據存儲系統。具體地,本發明涉及鏡像數據存儲系統中的錯誤檢測。
背景技術
在存儲系統(例如計算機中的磁盤系統或存儲器子系統)中經常要復制或鏡像存儲內容以在故障之后繼續操作;在存儲器子系統中這被稱作存儲器鏡像,而在磁盤存儲系統中則被稱作RAID?1。
已經意識到磁盤是計算機系統中與生俱來的不可靠部件。鏡像是一種允許系統自動保留多份數據拷貝的技術,以使得在磁盤硬件故障的情況下,系統能夠繼續處理或者快速恢復數據。鏡像可以在本地完成,此時鏡像專門用于應對磁盤的不可靠性;或者鏡像可以遠程完成,此時鏡像構成更加復雜的災難恢復方案的一部分;或者鏡像可以既在本地完成又遠程地完成,特別是對于高可靠性系統。通常數據被鏡像到物理相同的驅動器上,但是該過程也可以被應用于邏輯驅動器,其中下層的物理格式被隱含在鏡像過程中。通常鏡像被設置為硬件解決方案(例如磁盤陣列)或者被設置為操作系統中的軟件。
在運行的存儲系統中,從存儲器中讀回的值中發現少量錯誤并不罕見。在隨機存取存儲器(RAM)中,會因為由阿爾法粒子或宇宙射線在RAM內的相互作用造成的故障單元和臨時性故障而出現錯誤。為了處理這些偶爾出現的錯誤,系統包括有錯誤校驗碼(ECC)。
ECC存儲了一些附加的數據位作為存儲塊的摘要。在重新載入數據時,根據載入數據(Dr)重新計算ECC(Ec)并將其與從存儲器中讀取的ECC摘要信息(E)相比較。如果它們不相同,那么(對于某些錯誤)ECC就能夠指示要針對哪一位以恢復初始值。
任何特定的ECC系統對于在給定的存儲塊內能夠檢測出的錯誤數量以及能夠校正多少錯誤都有限制。例如,ECC系統可以確保能夠保留足夠的信息以校正單個位的錯誤或檢測成對的錯誤。在這樣的系統中,如果塊內有3個位損壞,那么ECC可能可以檢測到錯誤或者也可能檢測不到,并且如果沒有檢測到,那么系統就無法在錯誤值和正確值之間加以區分。
在既有鏡像又有ECC的系統中,兩者通常是獨立的-意思就是說鏡像的每一側都有ECC,并且如果ECC檢測到無法校正的錯誤,那么唯一的選擇就是使用來自其他鏡像的數據。
參照圖1,示意圖示出的鏡像數據系統100包括第一鏡像110和第二鏡像120。
第一鏡像110包括存儲在存儲介質中的數據集合D1?111(英文有誤)。將ECC算法130應用于數據集合D1?111以生成ECC值E1?112。
類似地,第二鏡像120包括存儲在存儲介質中的數據集合D2?121。將相同的ECC算法130應用于數據集合D2?121以生成ECC值E2?122。
第一鏡像110中的恢復數據151包括從存儲介質中讀取的并且應該與數據集合D1?111相同的恢復數據集合Dr1?113(以虛線指示)。恢復數據集合Dr1?113將ECC算法130應用于自身以生成期望的ECC值Ec1?114。ECC恢復值Er1?115也是從存儲介質中讀取的并且應該與ECC值E1?112相同(以虛線指示)。
第二鏡像120中的恢復數據152包括從存儲介質中讀取的并且應該與數據集合D2?121相同的恢復數據集合Dr2?123。恢復數據集合Dr2?123將ECC算法130應用于自身以生成期望的ECC值Ec2?124。ECC恢復值Er2?125也是從存儲介質中讀取的并且應該與ECC值E2?122相同(以虛線指示)。
每一個鏡像都具有數據集合(D1、D2)和ECC值集合(E1、E2)。相同的算法被用于兩個鏡像以使E1=ECC(D1)和E2=ECC(D2)。在讀取時,恢復數據(Dr1、Dr2)被用于計算期望的ECC值Ec1=ECC(Dr1),Ec2=ECC(Dr2)。如果Ec1=E1,那么D1正確,如果Ec2=E2,那么D2正確。不匹配就表明數據或ECC數據損壞。如果有任意一項匹配,那該數據就被假定為正確。如果兩項都匹配,那就可以隨意選擇。ECC無法檢測的錯誤將允許讀取已損壞的數據。
也可以比較Dr1和Dr2來檢測錯誤。如果Dr1和Dr2不匹配(即使是通過了錯誤校驗),那么ECC未檢測到的錯誤已被檢測出來但是不能被校正,原因在于無法獲知Dr1和Dr2中哪一個才是正確的。
隨著計算集群規模的增長和存儲容量的增大,整個系統內的錯誤數量也會增加。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110352224.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





