[發明專利]一種面向糾刪碼的數據放置方法有效
| 申請號: | 201410269720.8 | 申請日: | 2014-06-17 |
| 公開(公告)號: | CN104035732B | 公開(公告)日: | 2017-01-18 |
| 發明(設計)人: | 王意潔;許方亮;裴曉強;符永銓;孫偉東;程力;李小勇;馬行空;王媛;趙越;林軒;熊澤宇 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06;G06F11/07 |
| 代理公司: | 國防科技大學專利服務中心43202 | 代理人: | 郭敏 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 糾刪碼 數據 放置 方法 | ||
技術領域
本發明涉及分布存儲系統的數據容錯技術,尤其是面向糾刪碼的數據放置方法。
背景技術
數據容錯是海量數據分布存儲的關鍵技術之一,數據容錯對于提高系統的可用性和可靠性至關重要。目前,數據容錯技術主要包括基于復制的容錯技術和基于糾刪碼的容錯技術。
基于復制的容錯技術簡單直觀,易于實現和部署,需要為每個數據對象創建若干同樣大小的副本,存儲空間開銷較大。基于糾刪碼的容錯技術通過將數據對象分割為多個數據塊,通過利用糾刪碼算法對原始的數據塊進行編碼得到冗余的數據塊,把多個數據塊的信息融合到較少的冗余信息中,有效節省存儲空間。與基于復制的容錯技術相比,基于糾刪碼的容錯技術具有冗余度低、存儲空間利用率高等優點,已經逐步成為大數據時代數據容錯的主流技術。
基于糾刪碼的容錯技術的基本思想是對k個原始數據塊進行編碼計算得到m個冗余數據塊;只需k+m個數據塊中的任意k個數據塊,就可通過解碼計算恢復得到原始的k個數據塊。
具體而言,每個冗余數據塊Cj(j=1,2,…,m)都是k個原始數據塊Di(i=1,2,…,k)的線性組合,編碼計算可表示為公式(1),其中,Gji(j=1,2,…,m,i=1,2,…,k)是數據塊編碼系數。也就是說,對于冗余數據塊Cj(j=1,2,…,m)而言,首先,編碼系數Gji(i=1,2,…,k)與數據塊Di(i=1,2,…,k)進行逐位相乘,得到k個新數據塊Tji=Gji×Di(i=1,2,…,k);然后,k個新數據塊Tji(i=1,2,…,k)進行逐位相加,得到冗余數據塊
Gj1×D1+…+Gji×Di+…+Gjk×Dk=Cj???????(1)
每個原始數據塊Di(i=1,2,…,k)都是其它任意k個可用數據塊Ej(j=1,2,…,k)(原始數據塊或者冗余數據塊)的線性組合,解碼計算可表示為公式(2),其中,Hij(i=1,2,…,k,j=1,2,…,k)是數據塊解碼系數。也就是說,對于原始數據塊Di(i=1,2,…,k)而言,首先,解碼系數Hij(j=1,2,…,k)與可用數據塊Ej(j=1,2,…,k)進行逐位相乘,得到k個新數據塊Sij=Hij×Ej(j=1,2,…,k);然后,k個新數據塊Sij(j=1,2,…,k)進行逐位相加,得到原始數據塊
Hi1×E1+…+Hij×Ej+…+Hik×Ek=Di????????(2)
盡管隨著技術的進步,各種軟硬件資源的可靠性得到了顯著提高,但是,隨著存儲資源規模的不斷擴大,資源的失效概率明顯上升。在大規模分布存儲系統中,資源失效是一種常態行為。在數據塊失效時,基于糾刪碼的容錯技術需要多個數據塊才能解碼恢復失效的原始數據塊,需要占用較多的網絡帶寬資源。
如何放置數據塊對分布存儲系統的數據訪問效率、數據可靠性和數據修復效率等系統性能都將產生重要影響。多存儲節點同時失效大多是由電源故障或網絡故障引起的,失效的多個存儲節點在拓撲上相距較近,如同一個機架中的存儲節點或連接于同一個交換機上的存儲節點。因此,數據放置越分散,數據的可靠性就會越高,但是,數據訪問效率就會越低,數據修復效率也會越低。但是,數據可靠性和數據訪問效率之間也不是完全矛盾的。如果數據訪問效率越高,那么,數據修復效率就會越高,在數據修復完成之前再次發生失效的概率就會越小,從而提高數據可靠性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410269720.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





