[發(fā)明專利]針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法有效
| 申請(qǐng)?zhí)枺?/td> | 201510848801.8 | 申請(qǐng)日: | 2015-11-27 |
| 公開(kāi)(公告)號(hào): | CN105487818B | 公開(kāi)(公告)日: | 2018-11-09 |
| 發(fā)明(設(shè)計(jì))人: | 張廣艷;楊松霖;舒繼武;鄭緯民 | 申請(qǐng)(專利權(quán))人: | 清華大學(xué) |
| 主分類號(hào): | G06F3/06 | 分類號(hào): | G06F3/06 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 張大威 |
| 地址: | 100084 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 冗余數(shù)據(jù) 數(shù)據(jù)服務(wù)器 去重 云存儲(chǔ)系統(tǒng) 數(shù)據(jù)路由 元數(shù)據(jù)服務(wù)器 特征指紋 客戶端 集群 重復(fù) 負(fù)載均衡策略 數(shù)據(jù)管理 磁盤使用率 高效快速 接收用戶 路由策略 路由節(jié)點(diǎn) 匹配確定 系統(tǒng)特性 相似指紋 選擇請(qǐng)求 上傳 客戶 | ||
1.一種針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法,其特征在于,所述系統(tǒng)包括多個(gè)數(shù)據(jù)存儲(chǔ)服務(wù)器組成的集群以及多個(gè)客戶端,其中,所述多個(gè)數(shù)據(jù)存儲(chǔ)服務(wù)器組成的集群包括由多個(gè)數(shù)據(jù)服務(wù)器組成的數(shù)據(jù)服務(wù)器集群和一個(gè)元數(shù)據(jù)服務(wù)器,所述方法包括以下步驟:
S1:所述多個(gè)客戶端接收用戶的上傳數(shù)據(jù),將所述數(shù)據(jù)組織成數(shù)據(jù)超塊以作為數(shù)據(jù)路由單位,并提取其中的數(shù)據(jù)路由特征指紋,用于數(shù)據(jù)路由選擇;
S2:所述元數(shù)據(jù)服務(wù)器與數(shù)據(jù)服務(wù)器集群根據(jù)路由策略來(lái)處理所述多個(gè)客戶端的數(shù)據(jù)路由選擇請(qǐng)求,其中,所述數(shù)據(jù)服務(wù)器集群對(duì)所述數(shù)據(jù)路由特征指紋進(jìn)行相似指紋匹配以確定相似路由節(jié)點(diǎn),所述元數(shù)據(jù)服務(wù)器根據(jù)負(fù)載均衡策略確定最終的數(shù)據(jù)路由地址;
S3:確定數(shù)據(jù)路由地址后,所述客戶端與相應(yīng)的數(shù)據(jù)服務(wù)器進(jìn)行交互,以將相似冗余數(shù)據(jù)發(fā)送至選擇的數(shù)據(jù)服務(wù)器,所述選擇的數(shù)據(jù)服務(wù)器在接收到相似冗余數(shù)據(jù)后,在線對(duì)冗余數(shù)據(jù)進(jìn)行快速去重。
2.根據(jù)權(quán)利要求1所述的針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法,其特征在于,根據(jù)局部相似路由算法生成所述路由策略。
3.根據(jù)權(quán)利要求1所述的針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法,其特征在于,所述步驟S2進(jìn)一步包括:
在上傳數(shù)據(jù)時(shí),每個(gè)客戶端對(duì)所述數(shù)據(jù)超塊進(jìn)行邏輯劃分,生成多個(gè)數(shù)據(jù)段,并根據(jù)采樣策略對(duì)每個(gè)數(shù)據(jù)段進(jìn)行指紋采樣,以獲取數(shù)據(jù)路由特征指紋;
所述客戶端與集群中的各數(shù)據(jù)服務(wù)器進(jìn)行指紋數(shù)據(jù)交互,通過(guò)查詢相似索引表確定各數(shù)據(jù)服務(wù)器的匹配信息;
所述客戶端與元數(shù)據(jù)服務(wù)器進(jìn)行通信,根據(jù)所述各數(shù)據(jù)服務(wù)器的匹配信息與集群中選擇的路由節(jié)點(diǎn)使用情況,確定最終的數(shù)據(jù)路由地址。
4.根據(jù)權(quán)利要求3所述的針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法,其特征在于,所述各數(shù)據(jù)服務(wù)器的匹配信息包括每個(gè)數(shù)據(jù)服務(wù)器的匹配成功的指紋個(gè)數(shù)。
5.根據(jù)權(quán)利要求3所述的針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法,其特征在于,所述采樣策略是基于布羅德最小獨(dú)立置換原理,對(duì)每個(gè)數(shù)據(jù)段進(jìn)行指紋采樣,并獲取數(shù)據(jù)路由特征指紋。
6.根據(jù)權(quán)利要求1所述的針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法,其特征在于,所述步驟S3進(jìn)一步包括:
所述數(shù)據(jù)服務(wù)器在接收到客戶端發(fā)送的存儲(chǔ)請(qǐng)求時(shí),啟動(dòng)相應(yīng)的數(shù)據(jù)處理線程,對(duì)到達(dá)的數(shù)據(jù)超塊進(jìn)行處理;
所述數(shù)據(jù)服務(wù)器在接收數(shù)據(jù)時(shí),根據(jù)數(shù)據(jù)路由特征指紋將相似容器元數(shù)據(jù)加載到內(nèi)存的相似索引查找子集,并與到達(dá)的數(shù)據(jù)超塊進(jìn)行數(shù)據(jù)冗余匹配;
如果未匹配到相似的數(shù)據(jù)超塊,則結(jié)合熱點(diǎn)索引庫(kù)進(jìn)一步地進(jìn)行數(shù)據(jù)去重處理。
7.根據(jù)權(quán)利要求6所述的針對(duì)云存儲(chǔ)系統(tǒng)中重復(fù)冗余數(shù)據(jù)的高效去重方法,其特征在于,其中,所述數(shù)據(jù)服務(wù)器集群根據(jù)系統(tǒng)緩存中相似冗余數(shù)據(jù)的訪問(wèn)頻率異步更新所述熱點(diǎn)索引庫(kù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510848801.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 控制冗余數(shù)據(jù)包傳輸?shù)姆椒ā⒚襟w網(wǎng)關(guān)及系統(tǒng)
- 數(shù)據(jù)處理方法及裝置
- 數(shù)據(jù)傳輸?shù)姆椒ê脱b置
- 一種數(shù)據(jù)冗余的方法及裝置
- 一種機(jī)載激光雷達(dá)航帶間冗余數(shù)據(jù)自動(dòng)去除方法
- 通道檢測(cè)及管理信息傳遞的冗余數(shù)據(jù)交互系統(tǒng)
- 一種存儲(chǔ)系統(tǒng)大數(shù)據(jù)優(yōu)化方法及裝置
- 一種數(shù)據(jù)傳輸?shù)姆椒ê驮O(shè)備
- 3D模型中冗余數(shù)據(jù)的清除方法、裝置及電子設(shè)備
- 一種知識(shí)庫(kù)的構(gòu)建方法及裝置
- 一種接管故障元數(shù)據(jù)服務(wù)器的方法、裝置及系統(tǒng)
- 分布式文件系統(tǒng)訪問(wèn)方法、元數(shù)據(jù)服務(wù)器及客戶端
- 移動(dòng)通信異地?cái)?shù)據(jù)分享系統(tǒng)
- 一種元數(shù)據(jù)服務(wù)器熱點(diǎn)均衡方法
- 數(shù)據(jù)修復(fù)方法、裝置和系統(tǒng)
- 一種遠(yuǎn)程目錄分支點(diǎn)維護(hù)系統(tǒng)及其方法
- 一種管理學(xué)教學(xué)用模塊化實(shí)訓(xùn)系統(tǒng)
- 服務(wù)器故障熱切換方法、裝置和系統(tǒng)
- 一種元數(shù)據(jù)服務(wù)器的服務(wù)控制方法及裝置
- 數(shù)據(jù)存儲(chǔ)系統(tǒng)及方法
- 一種葉輪動(dòng)平衡校正的精確去重方法
- 一種基于文件語(yǔ)義和系統(tǒng)實(shí)時(shí)狀態(tài)的冗余數(shù)據(jù)去重方法
- 屏蔽電機(jī)上座及其屏蔽泵
- 一種文本去重方法和裝置
- 一種數(shù)據(jù)計(jì)數(shù)去重方法、系統(tǒng)、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種去重流量提示方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于解析去重邏輯的去重平臺(tái)測(cè)試方法、裝置及計(jì)算機(jī)設(shè)備
- 一種海量互聯(lián)網(wǎng)新聞清洗系統(tǒng)
- 文本數(shù)據(jù)的去重方法、設(shè)備及存儲(chǔ)介質(zhì)
- 文本去重方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于云計(jì)算的數(shù)據(jù)存儲(chǔ)系統(tǒng)
- 一種多云存儲(chǔ)系統(tǒng)間資源共享的系統(tǒng)
- 異構(gòu)式云存儲(chǔ)系統(tǒng)及其數(shù)據(jù)處理方法
- 一種云存儲(chǔ)系統(tǒng)調(diào)度方法和裝置
- 一種視頻數(shù)據(jù)處理方法、裝置及系統(tǒng)
- 一種云存儲(chǔ)系統(tǒng)文件去重方法及系統(tǒng)
- 云存儲(chǔ)系統(tǒng)性能評(píng)測(cè)方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 在基于云的存儲(chǔ)系統(tǒng)中服務(wù)I/O操作
- 異構(gòu)云存儲(chǔ)系統(tǒng)的數(shù)據(jù)處理方法及其可讀介質(zhì)和系統(tǒng)
- 云游戲數(shù)據(jù)存儲(chǔ)和檢索的高速數(shù)據(jù)通信架構(gòu)的系統(tǒng)和方法





