[發(fā)明專利]一種基于分布式存儲(chǔ)系統(tǒng)的糾刪碼編碼布局方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202111481100.7 | 申請(qǐng)日: | 2021-12-06 |
| 公開(kāi)(公告)號(hào): | CN114237971A | 公開(kāi)(公告)日: | 2022-03-25 |
| 發(fā)明(設(shè)計(jì))人: | 宋瑩;穆天童;楊明杰 | 申請(qǐng)(專利權(quán))人: | 北京信息科技大學(xué) |
| 主分類(lèi)號(hào): | G06F11/10 | 分類(lèi)號(hào): | G06F11/10;G06F16/182 |
| 代理公司: | 北京律誠(chéng)同業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11006 | 代理人: | 祁建國(guó);陳思遠(yuǎn) |
| 地址: | 100101 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 分布式 存儲(chǔ)系統(tǒng) 糾刪碼 編碼 布局 方法 系統(tǒng) | ||
本發(fā)明提出一種分布式存儲(chǔ)系統(tǒng)的糾刪碼編碼布局方法和系統(tǒng),以在分布式系統(tǒng)有數(shù)據(jù)丟失時(shí)通過(guò)減少恢復(fù)的數(shù)據(jù)傳輸量及恢復(fù)時(shí)長(zhǎng),從而提高整個(gè)系統(tǒng)的恢復(fù)效率和可靠性。本發(fā)明在傳統(tǒng)RS糾刪碼存儲(chǔ)的基礎(chǔ)上增加了節(jié)點(diǎn)內(nèi)部的奇偶校驗(yàn)計(jì)算,使用不同n、k值的RS編碼,并將奇偶校驗(yàn)計(jì)算結(jié)果存儲(chǔ)于當(dāng)前節(jié)點(diǎn)中,這樣在出現(xiàn)少量數(shù)據(jù)丟失或節(jié)點(diǎn)故障時(shí),可以從節(jié)點(diǎn)自身解碼奇偶檢驗(yàn)塊,以達(dá)到減少恢復(fù)產(chǎn)生的跨機(jī)架、跨節(jié)點(diǎn)網(wǎng)絡(luò)帶寬的目的。
技術(shù)領(lǐng)域
本發(fā)明涉及分布式存儲(chǔ)計(jì)算及數(shù)據(jù)恢復(fù)領(lǐng)域,并特別涉及一種提高恢復(fù)效率的基于分布式存儲(chǔ)系統(tǒng)的糾刪碼編碼布局方法,屬于分布式計(jì)算領(lǐng)域。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),數(shù)據(jù)存儲(chǔ)的方式也逐漸由單機(jī)存儲(chǔ)轉(zhuǎn)向分布式存儲(chǔ)。目前最流行的大數(shù)據(jù)開(kāi)源框架是Hadoop,一個(gè)能夠離線并行處理海量數(shù)據(jù)的大數(shù)據(jù)平臺(tái),具有高可靠性、高可擴(kuò)展性、高效率以及低成本、開(kāi)源等特性,成為了許多互聯(lián)網(wǎng)公司首選的海量數(shù)據(jù)處理方案。Hadoop主要包括Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce分布式計(jì)算框架,雖然Hadoop發(fā)展至3.x已經(jīng)比較成熟,但是有些方面依然存在不足,需要改進(jìn)和優(yōu)化。
分布式集群(如Hadoop)通常由許多獨(dú)立的不可靠商用組件組成,組件出現(xiàn)故障是很常見(jiàn)的。為了保證數(shù)據(jù)在這樣的分布式存儲(chǔ)系統(tǒng)中的高可靠性和可用性,常見(jiàn)的兩種方式是用多副本和糾刪碼來(lái)提供容錯(cuò)。多副本形式易于部署和故障恢復(fù),但存儲(chǔ)開(kāi)銷(xiāo)太大,不適用于數(shù)據(jù)量過(guò)大且磁盤(pán)空間較小的系統(tǒng)。糾刪碼作為一種替代方案,提供與多副本接近的容錯(cuò)性,且存儲(chǔ)開(kāi)銷(xiāo)更低,部分分布式系統(tǒng)中已經(jīng)部署了該方案。這將存儲(chǔ)冗余由傳統(tǒng)的3x減少到了1.4x,節(jié)省了更多的空間。但是使用糾刪碼恢復(fù)一個(gè)失敗的塊需要檢索多個(gè)可用的塊,這導(dǎo)致了很高的恢復(fù)成本。盡管糾刪碼提高了存儲(chǔ)效率,但它們顯著增加了故障恢復(fù)的磁盤(pán)I/O和網(wǎng)絡(luò)帶寬占用。
為了最大限度地提高使用糾刪碼部署的分布式存儲(chǔ)系統(tǒng)的數(shù)據(jù)可用性,將糾刪碼的不同塊存儲(chǔ)在不同機(jī)架的節(jié)點(diǎn)中。這種數(shù)據(jù)布局方式使系統(tǒng)能夠容忍一定數(shù)量的節(jié)點(diǎn)故障和機(jī)架故障。然而,這種數(shù)據(jù)塊放置方式不可避免的會(huì)使任何故障數(shù)據(jù)塊的修復(fù)需要從其他機(jī)架檢索可用的數(shù)據(jù)塊,因此會(huì)占用大量跨機(jī)架帶寬。通常,每個(gè)節(jié)點(diǎn)的可用跨機(jī)架帶寬僅為內(nèi)部機(jī)架帶寬的1/20至1/5。因此,在分布式存儲(chǔ)系統(tǒng)中,內(nèi)部機(jī)架帶寬被認(rèn)為是足夠的,但跨機(jī)架帶寬并不富裕,通常被認(rèn)為是一種稀缺資源,過(guò)多的跨機(jī)架流量不可避免地會(huì)延遲恢復(fù)過(guò)程,降低恢復(fù)效率。
發(fā)明內(nèi)容
本發(fā)明提供了一種用以提高數(shù)據(jù)恢復(fù)效率的糾刪碼編碼布局方法,以在分布式系統(tǒng)有數(shù)據(jù)丟失時(shí)通過(guò)減少恢復(fù)的數(shù)據(jù)傳輸量及恢復(fù)時(shí)長(zhǎng),從而提高整個(gè)系統(tǒng)的恢復(fù)效率和可靠性。本發(fā)明在傳統(tǒng)RS糾刪碼存儲(chǔ)的基礎(chǔ)上增加了節(jié)點(diǎn)內(nèi)部的奇偶校驗(yàn)計(jì)算,使用不同n、k值的RS編碼,并將奇偶校驗(yàn)計(jì)算結(jié)果存儲(chǔ)于當(dāng)前節(jié)點(diǎn)中,這樣在出現(xiàn)少量數(shù)據(jù)丟失或節(jié)點(diǎn)故障時(shí),可以從節(jié)點(diǎn)自身解碼奇偶檢驗(yàn)塊,以達(dá)到減少恢復(fù)產(chǎn)生的跨機(jī)架、跨節(jié)點(diǎn)網(wǎng)絡(luò)帶寬的目的。具體來(lái)說(shuō),本發(fā)明包括以下步驟:
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提出一種基于分布式存儲(chǔ)系統(tǒng)的糾刪碼編碼布局方法,其中包括:
步驟1、獲取具有多個(gè)存儲(chǔ)節(jié)點(diǎn)的分布式存儲(chǔ)系統(tǒng),并根據(jù)該分布式存儲(chǔ)系統(tǒng)的存儲(chǔ)節(jié)點(diǎn)數(shù)量設(shè)定橫向、縱向編碼參數(shù),并將所有存儲(chǔ)節(jié)點(diǎn)按存儲(chǔ)內(nèi)容劃分為用于存儲(chǔ)數(shù)據(jù)塊的數(shù)據(jù)節(jié)點(diǎn)和用于存儲(chǔ)橫向校驗(yàn)塊的校驗(yàn)節(jié)點(diǎn);
步驟2、根據(jù)該橫向、縱向編碼參數(shù),分別縱向和橫向糾刪編碼各數(shù)據(jù)節(jié)點(diǎn)上的每個(gè)原始數(shù)據(jù)塊,得到各個(gè)原始數(shù)據(jù)塊對(duì)應(yīng)的縱向校驗(yàn)塊和橫向校驗(yàn)塊;將橫向校驗(yàn)塊保存至校驗(yàn)節(jié)點(diǎn),并將縱向校驗(yàn)塊保存至與之對(duì)應(yīng)原始數(shù)據(jù)塊所在的該數(shù)據(jù)節(jié)點(diǎn);
步驟3、當(dāng)數(shù)據(jù)丟失時(shí),判斷丟失數(shù)據(jù)是否屬于原始數(shù)據(jù)塊,若是,則解碼丟失數(shù)據(jù)所在數(shù)據(jù)節(jié)點(diǎn)的縱向校驗(yàn)塊,以恢復(fù)丟失數(shù)據(jù),并存入該丟失數(shù)據(jù)所在的數(shù)據(jù)節(jié)點(diǎn);否則判斷該丟失數(shù)據(jù)是否屬于縱向校驗(yàn)塊,若是,則對(duì)該丟失數(shù)據(jù)進(jìn)行縱向糾刪編碼,以恢復(fù)丟失數(shù)據(jù),并存入該丟失數(shù)據(jù)所在的數(shù)據(jù)節(jié)點(diǎn);否則該丟失數(shù)據(jù)屬于橫向校驗(yàn)塊,對(duì)該丟失數(shù)據(jù)進(jìn)行橫向糾刪編碼,以恢復(fù)丟失數(shù)據(jù),并存入該校驗(yàn)節(jié)點(diǎn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京信息科技大學(xué),未經(jīng)北京信息科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111481100.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 用于處理到遠(yuǎn)程存儲(chǔ)位置的故障恢復(fù)的方法、系統(tǒng)以及程序
- 包括向外擴(kuò)展型存儲(chǔ)系統(tǒng)的存儲(chǔ)系統(tǒng)群及其管理方法
- 一種移動(dòng)存儲(chǔ)系統(tǒng)及其存儲(chǔ)方法
- 存儲(chǔ)系統(tǒng)的數(shù)據(jù)備份與恢復(fù)系統(tǒng)、方法、設(shè)備及存儲(chǔ)介質(zhì)
- 在線遷移異構(gòu)系統(tǒng)數(shù)據(jù)的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 建立存儲(chǔ)系統(tǒng)伙伴關(guān)系的方法及裝置
- 數(shù)據(jù)處理系統(tǒng)及其操作方法
- 一種容災(zāi)平臺(tái)及一種容災(zāi)方法
- 在基于云的存儲(chǔ)系統(tǒng)中服務(wù)I/O操作
- 一種數(shù)據(jù)修復(fù)方法及裝置
- 發(fā)送裝置及發(fā)送方法
- 一種存儲(chǔ)系統(tǒng)糾刪碼編碼、解碼電路及編解碼電路
- 基于NVRAM存儲(chǔ)系統(tǒng)直接糾刪碼的優(yōu)化方法和系統(tǒng)
- 一種數(shù)據(jù)存儲(chǔ)、重構(gòu)方法和裝置、及電子設(shè)備
- 一種通過(guò)糾刪碼對(duì)數(shù)據(jù)的處理方法及裝置
- 一種基于糾刪碼的糾刪池的創(chuàng)建方法及相關(guān)裝置
- 一種糾刪碼讀請(qǐng)求處理方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)介質(zhì)
- 數(shù)據(jù)操作方法、裝置和分布式存儲(chǔ)系統(tǒng)
- 一種基于糾刪碼的新媒體圖像的篡改恢復(fù)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、設(shè)備及介質(zhì)





