日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于流水線的分布式多表連接方法及系統(tǒng)有效

專利信息
申請?zhí)枺?/td> 201710361245.0 申請日: 2017-05-19
公開(公告)號: CN107229692B 公開(公告)日: 2018-05-01
發(fā)明(設計)人: 王宏志;孫旭冉;趙志強 申請(專利權)人: 哈工大大數(shù)據(jù)產業(yè)有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京格允知識產權代理有限公司11609 代理人: 周嬌嬌,譚輝
地址: 150001 黑龍江省哈爾濱市經(jīng)*** 國省代碼: 黑龍江;23
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 流水線 分布式 連接 方法 系統(tǒng)
【說明書】:

技術領域

發(fā)明涉及分布式數(shù)據(jù)計算技術,尤其涉及一種基于流水線的分布式多表連接方法及系統(tǒng)。

背景技術

大數(shù)據(jù)時代的到來,帶動了數(shù)據(jù)量的迅猛增長,急需一種技術來存儲和處理如此龐大的數(shù)據(jù)量,由此,谷歌的DFS(分布式文件系統(tǒng))和分布式計算模型MapReduce(映射和規(guī)約)應運而生,如今分布式計算技術已成為海量數(shù)據(jù)存儲分析的主流技術。對于海量數(shù)據(jù)分析,連接查詢是一種重要的操作,并且在實際應用時,所需的數(shù)據(jù)可能不僅僅局限于某一個表,而是涉及到多個表,這給連接操作帶來了一定的難度。

在執(zhí)行連接查詢之前,首先要對相應數(shù)據(jù)進行分割,通常的做法是對數(shù)據(jù)進行哈希分割或范圍分割。現(xiàn)有技術中提出了一種自適應的分割方法。此方法使用了一種雙階段的分割算法對數(shù)據(jù)進行了基于屬性的分割:第一階段,依據(jù)連接屬性對最頂層數(shù)據(jù)進行分割;第二階段,依據(jù)數(shù)據(jù)規(guī)模和規(guī)約器(reduce)個數(shù)對底層數(shù)據(jù)進行進一步的分割。這樣的分割算法保證了每一個分割樹都包含單一的連接屬性。當這種自適應的分割算法檢測到一個包含著新的連接屬性的輸入查詢時,它將以同樣的雙階段方法生成一個新的分割樹,該分割樹以新的查詢操作包含的連接屬性為劃分依據(jù),并且初始狀態(tài)為空。隨著查詢操作的進行,這種分割算法將隨機地從舊的分割樹中選取適當規(guī)模的數(shù)據(jù)進行重分割,并逐漸地將數(shù)據(jù)移動到新的分割樹中,直至新的分割樹中包含的數(shù)據(jù)滿足新的查詢操作。這種基于雙階段的自適應分割算法可以有效地對數(shù)據(jù)進行基于連接屬性的分割,并且避免了出現(xiàn)包含新的連接屬性的查詢操作時,全部數(shù)據(jù)的重新分割,實現(xiàn)了自適應。

然而,這種自適應分割算法主要針對兩表連接的情況,如將其應用于多表連接上,則需要首先執(zhí)行前兩個表的連接操作,再把連接的結果看作一個新的表,和下一個表進行連接,以此類推,直到完成所有表的連接。顯然這會產生大量的中間結果,造成很大的I/O開銷,是一種效率極低的方法,而在實際應用中,多表連接又是非常常見的操作。

發(fā)明內容

本發(fā)明要解決的技術問題是,針對現(xiàn)有的數(shù)據(jù)分割方法在應用于對多表進行連接時效率低的缺陷,提供一種基于流水線的分布式多表連接方法及系統(tǒng)。

為了解決上述技術問題,本發(fā)明提供了一種基于流水線的分布式多表連接方法,該方法包括并行執(zhí)行的以下步驟:

A、映射處理單元從分布式文件系統(tǒng)讀取待連接表,將所述待連接表進行映射處理后得到對應的數(shù)據(jù)塊,并以每兩個待連接表為一組,將第一組表的數(shù)據(jù)塊輸出至第一規(guī)約處理單元,將第二組至末尾組表的數(shù)據(jù)塊按序輸出至第二規(guī)約處理單元;

B、第二規(guī)約處理單元按序讀取第二組至末尾組表的數(shù)據(jù)塊,并對每組表的兩個數(shù)據(jù)塊進行哈希連接得到每組表的兩表連接結果;

C、第一規(guī)約處理單元讀取第一組表的兩個數(shù)據(jù)塊進行哈希連接后作為初始的多表連接結果,并在等待第二規(guī)約處理單元完成一組表的哈希連接后,將當前的多表連接結果與該組表的兩表連接結果進行順序連接以更新多表連接結果,直至所有組表完成連接后輸出多表連接結果。

在根據(jù)本發(fā)明所述的基于流水線的分布式多表連接方法中,所述步驟A包括以下步驟:

在t1時刻,映射處理單元讀取待連接表T1至T4,對所述待連接表T1至T4進行映射處理后得到對應的數(shù)據(jù)塊B1至B4,并將第一組表的數(shù)據(jù)塊B1和B2輸出至所述第一規(guī)約處理單元,將第二組表的數(shù)據(jù)塊B3和B4輸出至所述第二規(guī)約處理單元;

在ti時刻,其中i=2,3,…,j-1,j為待連接表的組數(shù);映射處理單元讀取待連接表T2i+1和T2i+2,對所述待連接表T2i+1和T2i+2進行映射處理后得到第i+1組表的數(shù)據(jù)塊B2i+1至B2i+2,并輸出至第二規(guī)約處理單元。

在根據(jù)本發(fā)明所述的基于流水線的分布式多表連接方法中,所述步驟B包括以下步驟:在ti時刻,其中i=2,3,…,j;第二規(guī)約處理單元讀取第i組表的數(shù)據(jù)塊B2i-1至B2i進行哈希連接后得到第i組表的兩表連接結果Hi

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈工大大數(shù)據(jù)產業(yè)有限公司,未經(jīng)哈工大大數(shù)據(jù)產業(yè)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710361245.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲一级中文字幕| 日韩欧美精品一区二区| 午夜片在线| 中文字幕av一区二区三区四区| 91精品国产一区二区三区| 99久久精品国| 国产色午夜婷婷一区二区三区 | 日本精品一二三区| 欧美日韩国产免费观看| 国产在线干| 国产日韩欧美91| 国产精品美乳在线观看| 国产精品入口麻豆九色| 国产欧美一区二区三区免费| 国产精品一区二区免费视频| 日韩精品一区二区中文字幕| 一区不卡av| 不卡在线一区二区| 国产亚洲欧美日韩电影网| 国产精品久久久久久久久久久久久久久久久久 | 欧美综合国产精品久久丁香| 欧美一区二区三区久久| 人人澡超碰碰97碰碰碰| 国产一区正在播放| 激情aⅴ欧美一区二区三区| www.日本一区| 久久九九国产精品| 亚洲国产精品国自产拍av| 国内精品在线免费| 国产毛片精品一区二区| 蜜臀久久99精品久久一区二区| 色综合久久久久久久粉嫩| 国产精品视频一二区| 欧美中文字幕一区二区| 在线精品视频一区| 久久精品com| 国产精品久久免费视频| 久久免费视频99| 午夜666| 淫片免费看| 国产999久久久| 91久久免费| 日韩欧美一区二区久久婷婷| 精品国产乱码久久久久久久久 | 午夜免费av电影| 一区二区在线精品| 99精品视频免费看| 97精品久久久午夜一区二区三区| 激情久久一区二区| 欧美日韩精品在线播放| 欧美日韩久久一区二区| 国产精品自拍在线观看| 17c国产精品一区二区| 色一情一交一乱一区二区三区| 精品久久久影院| 国产一区免费在线观看| 免费看大黄毛片全集免费| 国产精品自拍在线观看| 香港三日本三级三级三级| 亚洲国产一区二区久久久777| 亚洲精品卡一卡二| 午夜剧场一区| 999久久国精品免费观看网站| 日韩午夜一区| 黄色国产一区二区| 亚洲精品国产setv| 狠狠色狠狠色综合日日五| 国产不卡一区在线| 自拍偷在线精品自拍偷无码专区| 欧美67sexhd| 久久久综合亚洲91久久98| 欧美一区二区激情三区| 国产精品5区| sb少妇高潮二区久久久久| 亚洲欧洲精品一区二区三区不卡| 自拍偷在线精品自拍偷无码专区 | 性生交大片免费看潘金莲| 综合色婷婷一区二区亚洲欧美国产 | 午夜黄色网址| 国产69精品久久777的优势| 久久伊人色综合| 久久午夜鲁丝片午夜精品|