[發(fā)明專利]一種分布式存儲系統(tǒng)中數(shù)據(jù)分布的方法及裝置有效
| 申請?zhí)枺?/td> | 201710312963.9 | 申請日: | 2017-05-05 |
| 公開(公告)號: | CN107168649B | 公開(公告)日: | 2019-12-17 |
| 發(fā)明(設(shè)計)人: | 強慧媛;楊洪章 | 申請(專利權(quán))人: | 南京城市職業(yè)學(xué)院 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06 |
| 代理公司: | 32252 南京鐘山專利代理有限公司 | 代理人: | 戴朝榮 |
| 地址: | 210038 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 分布式 存儲系統(tǒng) 數(shù)據(jù) 分布 方法 裝置 | ||
本發(fā)明提供一種分布式存儲系統(tǒng)中數(shù)據(jù)分布的方法及裝置,其中,所述方法包括:當(dāng)所述分布式存儲系統(tǒng)初始化時,加載初始化信息;當(dāng)在所述分布式存儲系統(tǒng)中寫入目標文件時,根據(jù)所述目標文件的尺寸以及文件塊尺寸,將所述目標文件劃分為多個切片;在所述分布式存儲系統(tǒng)中的節(jié)點中確定邏輯起始點,并確定邏輯分組長度;將節(jié)點按照邏輯分組長度劃分為多個邏輯組,并在各個邏輯組中分別選取一個偏移節(jié)點;基于所述邏輯起始點、各個偏移節(jié)點以及節(jié)點總數(shù),確定物理分組;將根據(jù)所述目標文件劃分得到的所述多個切片依次存放于所述物理分組內(nèi)的各個節(jié)點中。本發(fā)明提供的技術(shù)方案,能夠同時滿足均衡性高、可靠性強、計算量小的評價指標。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)存儲技術(shù)領(lǐng)域,特別涉及一種分布式存儲系統(tǒng)中數(shù)據(jù)分布的方法及裝置。
背景技術(shù)
在分布式存儲系統(tǒng)中,文件的數(shù)據(jù)內(nèi)容以塊為粒度進行切分并將其分散存儲在不同的存儲節(jié)點中,已成為一種通常的處理手段(以下簡稱分布式的處理手段)。塊的尺寸可根據(jù)系統(tǒng)中普遍的文件尺寸進行設(shè)置,典型的塊大小為4KB至4MB不等。相較于集中式的處理手段,分布式的處理手段通過數(shù)據(jù)塊分散存儲在不同節(jié)點,可以充分地發(fā)揮存儲系統(tǒng)的并發(fā)處理能力。例如讀取同一個尺寸為64MB的文件,集中式的處理手段產(chǎn)生的時延為一次讀取64MB的時延,而分布式的處理手段產(chǎn)生的時延僅為64路并發(fā)讀取1MB的時延,顯然分布式的處理手段大幅降低了讀取操作的時延。
因此,文件的數(shù)據(jù)內(nèi)容在以塊為粒度切分之后,如何分布在各存儲節(jié)點中,成為當(dāng)前分布式存儲系統(tǒng)領(lǐng)域的重要技術(shù)熱點。一般地,評價一種數(shù)據(jù)分布方法的優(yōu)劣,主要從均衡性、可靠性以及計算量方法進行考量。
現(xiàn)有的數(shù)據(jù)分布方法包括:
1.隨機選取方法。該種方式在為數(shù)據(jù)塊分配節(jié)點時完全隨機,從宏觀上來說,對于大規(guī)模的存儲系統(tǒng)而言,各節(jié)點的數(shù)據(jù)塊將會十分均衡;計算量也很小;但這種完全隨機的方法無法顯性地控制數(shù)據(jù)的各副本不在同一個故障域中,一種極端的情況甚至是同一文件的各數(shù)據(jù)塊及副本被分配到同一節(jié)點中。另外,在小規(guī)模的存儲系統(tǒng)中,各節(jié)點的均衡性難以保證。
2.固定分段選取方法。該種方式根據(jù)故障域進行分段,在段內(nèi)進行隨機選取節(jié)點,這種方式提供了較好的可靠性,計算量也不大,但是由于故障域是固定的,因此分段也是固定的,數(shù)據(jù)分布結(jié)果的可能性十分有限;同時,在節(jié)點數(shù)量無法被段數(shù)整除的情況下,亦無法保證各段的節(jié)點數(shù)量相等,因此均衡性難以得到滿足。
3.哈希選取方法。該種方式為每一個切片分配一個全局唯一的號碼,并通過某種計算規(guī)則求得散列值,然后對節(jié)點數(shù)進行求余操作,其余數(shù)即為切片所存儲的節(jié)點。該種方法具有較好的均衡性,但計算量較大,可靠性略差。
由上可見,現(xiàn)有技術(shù)中的數(shù)據(jù)分布存儲方法,均無法同時滿足均衡性高、可靠性強、計算量小的評價指標。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種分布式存儲系統(tǒng)中數(shù)據(jù)分布的方法及裝置,能夠同時滿足均衡性高、可靠性強、計算量小的評價指標。
為實現(xiàn)上述目的,本發(fā)明提供一種分布式存儲系統(tǒng)中數(shù)據(jù)分布的方法,所述方法包括:當(dāng)所述分布式存儲系統(tǒng)初始化時,加載初始化信息;其中,所述初始化信息包括所述分布式存儲系統(tǒng)中的節(jié)點總數(shù)、單文件分配節(jié)點數(shù)以及文件塊尺寸;當(dāng)在所述分布式存儲系統(tǒng)中寫入目標文件時,根據(jù)所述目標文件的尺寸以及所述文件塊尺寸,將所述目標文件劃分為多個切片;在所述分布式存儲系統(tǒng)中的節(jié)點中確定邏輯起始點,并根據(jù)所述節(jié)點總數(shù)和所述單文件分配節(jié)點數(shù),確定邏輯分組長度;將所述分布式存儲系統(tǒng)中的節(jié)點按照邏輯分組長度劃分為多個邏輯組,并在各個邏輯組中分別選取一個偏移節(jié)點;基于所述邏輯起始點、各個偏移節(jié)點以及所述節(jié)點總數(shù),確定物理分組;其中,所述物理分組中的節(jié)點的數(shù)量與所述偏移節(jié)點的數(shù)量相同;將根據(jù)所述目標文件劃分得到的所述多個切片依次存放于所述物理分組內(nèi)的各個節(jié)點中。
進一步地,按照下述公式將所述目標文件劃分為多個切片:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京城市職業(yè)學(xué)院,未經(jīng)南京城市職業(yè)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710312963.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 用于處理到遠程存儲位置的故障恢復(fù)的方法、系統(tǒng)以及程序
- 包括向外擴展型存儲系統(tǒng)的存儲系統(tǒng)群及其管理方法
- 一種移動存儲系統(tǒng)及其存儲方法
- 存儲系統(tǒng)的數(shù)據(jù)備份與恢復(fù)系統(tǒng)、方法、設(shè)備及存儲介質(zhì)
- 在線遷移異構(gòu)系統(tǒng)數(shù)據(jù)的方法、裝置、設(shè)備和存儲介質(zhì)
- 建立存儲系統(tǒng)伙伴關(guān)系的方法及裝置
- 數(shù)據(jù)處理系統(tǒng)及其操作方法
- 一種容災(zāi)平臺及一種容災(zāi)方法
- 在基于云的存儲系統(tǒng)中服務(wù)I/O操作
- 一種數(shù)據(jù)修復(fù)方法及裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





