日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種數(shù)據(jù)多副本混合存儲(chǔ)方法及系統(tǒng)有效

專利信息
申請(qǐng)?zhí)枺?/td> 201310368095.8 申請(qǐng)日: 2013-08-21
公開(公告)號(hào): CN103440301A 公開(公告)日: 2013-12-11
發(fā)明(設(shè)計(jì))人: 王穎;狄靜舒;宋懷明;苗艷超;劉新春;邵宗有 申請(qǐng)(專利權(quán))人: 曙光信息產(chǎn)業(yè)股份有限公司
主分類號(hào): G06F17/30 分類號(hào): G06F17/30;G06F11/14;H04L29/08
代理公司: 北京新知遠(yuǎn)方知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11397 代理人: 張艷
地址: 300384 天津市西青區(qū)華*** 國省代碼: 天津;12
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 數(shù)據(jù) 副本 混合 存儲(chǔ) 方法 系統(tǒng)
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及計(jì)算機(jī)領(lǐng)域,尤其涉及一種數(shù)據(jù)多副本混合存儲(chǔ)方法、數(shù)據(jù)多副本混合存儲(chǔ)系統(tǒng)及數(shù)據(jù)處理方法。

背景技術(shù)

在大數(shù)據(jù)處理領(lǐng)域,數(shù)據(jù)通常是分片存儲(chǔ)的,數(shù)據(jù)分區(qū)的目的不僅僅是將數(shù)據(jù)分布式存儲(chǔ)。為了進(jìn)一步保證可靠性,還會(huì)采用副本技術(shù)。目前,現(xiàn)有的大數(shù)據(jù)分區(qū)存儲(chǔ)技術(shù),針對(duì)一份數(shù)據(jù)的多個(gè)副本都是采用相同的分區(qū)方式。減少加載階段的計(jì)算量的同時(shí),如果數(shù)據(jù)的某個(gè)副本出錯(cuò)或者丟失時(shí),可直接拷貝其他存在的正確的副本即可恢復(fù);數(shù)據(jù)有修改時(shí),也可以直接對(duì)相應(yīng)的多個(gè)副本同時(shí)修改即可。在某些操作中,合理的數(shù)據(jù)分區(qū)可以減少數(shù)據(jù)處理過程中節(jié)點(diǎn)之間的數(shù)據(jù)傳輸開銷,進(jìn)而很大程度上提高數(shù)據(jù)分布式處理的效率。尤其是大表的連接操作,分區(qū)是很重要的技術(shù)方案。將連接操作按照相同的方式進(jìn)行分區(qū),對(duì)應(yīng)的分區(qū)內(nèi)部進(jìn)行連接操作,可以對(duì)多個(gè)分區(qū)同時(shí)進(jìn)行連接操作,這些連接操作可以在多個(gè)節(jié)點(diǎn)上并行執(zhí)行,同時(shí)不必有數(shù)據(jù)遷移和重分布的操作。這也是如今在內(nèi)存受限和網(wǎng)絡(luò)帶寬成為瓶頸的情況下,大表連接操作高效可行的方案。數(shù)據(jù)存儲(chǔ)和分區(qū)需要數(shù)據(jù)遷移,尤其是多節(jié)點(diǎn)之間的分布式存儲(chǔ)和分區(qū)需要消耗較高的網(wǎng)絡(luò)帶寬,查詢之前臨時(shí)進(jìn)行分區(qū)顯然會(huì)導(dǎo)致查詢效率大大降低,加載的時(shí)候采用預(yù)分區(qū)存儲(chǔ),可以一勞永逸地提高查詢效率。

例如:分布式文件系統(tǒng)HDFS,直接根據(jù)文件大小分塊存儲(chǔ),沒有考慮特定分區(qū)方式。即使構(gòu)建于之上的數(shù)據(jù)倉庫Hive和數(shù)據(jù)庫HBase提供了各自的分區(qū)功能,分布式文件系統(tǒng)HDFS的多個(gè)副本仍然是采用了相同的分區(qū)方式。還有,現(xiàn)有的NoSQL(也即Not?only?SQL)數(shù)據(jù)庫HBase僅采用了范圍劃分,也即Range分區(qū)這一種分區(qū)方式。而非關(guān)系數(shù)據(jù)庫Cassandra采用一致性Hash在多節(jié)點(diǎn)之間分布數(shù)據(jù)。

從以上說明可以看出,目前在大數(shù)據(jù)處理系統(tǒng)中,在數(shù)據(jù)加載時(shí)只會(huì)采用一種分區(qū)方式。如果連接的列和連接條件與分區(qū)不一致,仍然會(huì)導(dǎo)致數(shù)據(jù)大范圍的重分布操作,還是會(huì)導(dǎo)致很高的網(wǎng)絡(luò)帶寬開銷。也就是,如果分區(qū)是根據(jù)一列進(jìn)行的分區(qū),而連接操作是根據(jù)另一列進(jìn)行的,這種情況就是分區(qū)方式與連接操作的條件不一致,就需要大范圍的數(shù)據(jù)重分布操作。除此之外,很多業(yè)務(wù)可能需要針對(duì)同一批數(shù)據(jù)按照不同的分區(qū)進(jìn)行操作,例如,有的操作是按第一列進(jìn)行分組操作(data1?join?data2?on?col1或者group?by?col1),有的操作可能是按第二列進(jìn)行分組操作(data1?join?data2?on?col2或者group?by?col2)。因此,單一的分區(qū)方式在分區(qū)與連接操作不一致或同一批數(shù)據(jù)需要按不同分區(qū)進(jìn)行操作等場(chǎng)景就可能導(dǎo)致大范圍的數(shù)據(jù)重分布,在一定程度上限制了數(shù)據(jù)處理的效率。

發(fā)明內(nèi)容

針對(duì)現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明提出了一種數(shù)據(jù)多副本混合存儲(chǔ)方法及系統(tǒng),增加了數(shù)據(jù)分區(qū)的多樣性,使得更多場(chǎng)景的按照分組進(jìn)行的一類數(shù)據(jù)處理可以按照分區(qū)并行執(zhí)行,以增加少量加載階段的計(jì)算量為代價(jià),提高了更多場(chǎng)景的數(shù)據(jù)處理的計(jì)算效率。

為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種數(shù)據(jù)多副本混合存儲(chǔ)方法,主要技術(shù)方案如下:

在數(shù)據(jù)加載階段,將原始數(shù)據(jù)進(jìn)行多次分區(qū),每次分區(qū)采用不同的分區(qū)方式;

將每次分區(qū)所得到的分區(qū)數(shù)據(jù)存儲(chǔ)到多個(gè)服務(wù)器上。

所述分區(qū)方式為范圍Range分區(qū)、散列Hash分區(qū)、列表分區(qū)或混合分區(qū)。

將每次分區(qū)所得到的分區(qū)數(shù)據(jù)按存儲(chǔ)負(fù)載均衡原則、訪問負(fù)載均衡原則或數(shù)據(jù)可靠性原則存儲(chǔ)到各服務(wù)器上。

本發(fā)明還提供了一種數(shù)據(jù)多副本混合存儲(chǔ)系統(tǒng),包括:

分區(qū)模塊,用于在數(shù)據(jù)加載階段,將原始數(shù)據(jù)進(jìn)行多次分區(qū),其中,每次分區(qū)采用不同的分區(qū)方式;

服務(wù)器,用于存儲(chǔ)每次分區(qū)所得到的分區(qū)數(shù)據(jù)。

所述分區(qū)模塊具體用于按照范圍Range分區(qū)、散列分區(qū)Hash分區(qū)、列表分區(qū)或混合分區(qū)方式將原始數(shù)據(jù)進(jìn)行多次分區(qū)。

所述服務(wù)器具體用于根據(jù)存儲(chǔ)負(fù)載均衡原則、訪問負(fù)載均衡原則或數(shù)據(jù)可靠性原則存儲(chǔ)每次分區(qū)所得到的分區(qū)數(shù)據(jù)。

本發(fā)明還提供了一種數(shù)據(jù)處理方法,包括以下步驟:

在數(shù)據(jù)加載階段,將多組數(shù)據(jù)進(jìn)行多次分區(qū),每次分區(qū)采用不同的分區(qū)方式,每次分區(qū)時(shí)各組數(shù)據(jù)的分區(qū)方式相同;

將各次分區(qū)所得到的的分區(qū)數(shù)據(jù)存儲(chǔ)到多個(gè)服務(wù)器中;

其中,所述多組數(shù)據(jù)在同一次分區(qū)中得到的具有相同屬性的分區(qū)數(shù)據(jù)存儲(chǔ)于同一服務(wù)器中。

所述具有相同屬性的分區(qū)數(shù)據(jù)為:各組數(shù)據(jù)每次分區(qū)后,不同組數(shù)據(jù)之間屬性值相同的分區(qū)數(shù)據(jù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于曙光信息產(chǎn)業(yè)股份有限公司,未經(jīng)曙光信息產(chǎn)業(yè)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310368095.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 精品国产乱码久久久久久软件影片| 日韩av在线中文| 国产88av| 日韩精品一二区| 国产精品久久久久久一区二区三区| 一区二区免费播放| 精品一区二区在线视频| 91嫩草入口| 国产午夜精品一区二区三区最新电影 | 午夜国产一区二区三区四区| 美国三级日本三级久久99| 国产精品九九九九九| 91久久国语露脸精品国产高跟| 国产色一区二区| 99久久婷婷国产精品综合| 午夜一区二区视频| 99久久夜色精品国产网站| 久久国产这里只有精品| 中文字幕制服丝袜一区二区三区| 国产videosfree性另类| 精品亚洲午夜久久久久91| 日韩精品中文字幕一区二区三区| 国产区精品| 精品a在线| 亚洲欧美日韩国产综合精品二区 | 久久国产麻豆| 久久精品99国产精品亚洲最刺激| 自拍偷在线精品自拍偷无码专区| 狠狠色噜噜狠狠狠狠2021免费| 国产精品高潮呻吟88av| 日本一区二区高清| 九九视频69精品视频秋欲浓| 久久久午夜爽爽一区二区三区三州| 三级视频一区| 欧美一区二区三区三州| 欧美精品国产精品| 日韩av在线播放观看| 日韩午夜电影院| 精品999久久久| 国产精品久久国产精品99| 国产精品久久久久免费a∨大胸| 91精品国产高清一二三四区| 欧美国产一二三区| 99国产精品9| 久99久精品| 久久久精品二区| 日本少妇高潮xxxxⅹ| 国产69精品福利视频| 欧美激情综合在线| 欧美精选一区二区三区| 日韩av中文字幕第一页| 欧美日韩国产在线一区| 99久久精品一区二区| 亚洲国产日韩综合久久精品| 91麻豆精品国产91久久久久推荐资源| 国产精品奇米一区二区三区小说| 99国产精品免费| 麻豆精品久久久| 国产精品午夜一区二区| 丰满岳妇伦4在线观看| 日韩精品中文字幕一区二区三区| 欧美综合在线一区| 浪潮av色| 中文字幕一区2区3区| 91精品久久久久久综合五月天| 亚洲乱码av一区二区三区中文在线:| 欧美精品久| 一区二区三区国产精华| 91国偷自产一区二区介绍| 91精品丝袜国产高跟在线| 欧美精品五区| 国产欧美亚洲精品| 四虎国产精品久久| 99国产精品丝袜久久久久久| 国产经典一区二区三区| 亚洲精品日韩在线| 日本一二三区视频| 亚洲精品久久久中文| 国产91刺激对白在线播放| 亚洲四区在线| 99国产精品九九视频免费看| 国产精品国产三级国产专区51区|