[發(fā)明專(zhuān)利]一種數(shù)據(jù)處理的方法、存儲(chǔ)節(jié)點(diǎn)及協(xié)調(diào)節(jié)點(diǎn)有效
| 申請(qǐng)?zhí)枺?/td> | 201610173369.1 | 申請(qǐng)日: | 2016-03-24 |
| 公開(kāi)(公告)號(hào): | CN107229635B | 公開(kāi)(公告)日: | 2020-06-02 |
| 發(fā)明(設(shè)計(jì))人: | 張玥;彭貴平;王傳廷 | 申請(qǐng)(專(zhuān)利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06F16/27 | 分類(lèi)號(hào): | G06F16/27;G06F16/22 |
| 代理公司: | 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518129 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù)處理 方法 存儲(chǔ) 節(jié)點(diǎn) 協(xié)調(diào) | ||
本申請(qǐng)實(shí)施例公開(kāi)了一種數(shù)據(jù)處理的方法、存儲(chǔ)節(jié)點(diǎn)及協(xié)調(diào)節(jié)點(diǎn),本申請(qǐng)實(shí)施例方法包括:第一存儲(chǔ)節(jié)點(diǎn)根據(jù)第一表格數(shù)據(jù)中運(yùn)算列數(shù)據(jù)生成第一中間數(shù)據(jù),根據(jù)第二表格數(shù)據(jù)中運(yùn)算列數(shù)據(jù)生成第二中間數(shù)據(jù),再獲取第二存儲(chǔ)節(jié)點(diǎn)的第三中間數(shù)據(jù)的集合進(jìn)行表連接操作,由于第一中間數(shù)據(jù)、第二中間數(shù)據(jù),第三中間數(shù)據(jù)只包括相應(yīng)的連接運(yùn)算列數(shù)據(jù)和非連接運(yùn)算列數(shù)據(jù)的位置信息,不包括非連接運(yùn)算列數(shù)據(jù)的實(shí)際數(shù)據(jù),第一存儲(chǔ)節(jié)點(diǎn)中第一表格中運(yùn)算列數(shù)據(jù)與獲取的所有的第二表格的運(yùn)算列數(shù)據(jù)進(jìn)行的表連接操作,實(shí)際進(jìn)行的是它們對(duì)應(yīng)的中間數(shù)據(jù)進(jìn)行的表連接操作,降低了表連接操作時(shí)節(jié)點(diǎn)間數(shù)據(jù)的傳輸,極大節(jié)省了網(wǎng)絡(luò)帶寬,同時(shí)減少了表連接操作的總執(zhí)行時(shí)間。
技術(shù)領(lǐng)域
本申請(qǐng)涉及數(shù)據(jù)庫(kù)技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)處理的方法、存儲(chǔ)節(jié)點(diǎn)及協(xié)調(diào)節(jié)點(diǎn)。
背景技術(shù)
社會(huì)各行業(yè)的業(yè)務(wù)系統(tǒng)越來(lái)越互聯(lián)網(wǎng)化,服務(wù)的范圍無(wú)限擴(kuò)大化,導(dǎo)致海量用戶(hù)、海量智能設(shè)備的參與,從而導(dǎo)致數(shù)據(jù)爆發(fā)性的增長(zhǎng)。傳統(tǒng)基于單機(jī)的數(shù)據(jù)庫(kù)技術(shù)已經(jīng)無(wú)法支撐海量數(shù)據(jù)的分析處理,在此情況下,基于MPP(Massively Parallel Processing)并行計(jì)算的并行數(shù)據(jù)庫(kù)集群應(yīng)運(yùn)而生。
在這些使用場(chǎng)景中,常常存在數(shù)據(jù)量很大的表,而且這種表的字段很多,甚至能達(dá)到幾百個(gè)字段。為了取得較好的性能,這樣的大表都會(huì)做水平分區(qū)(根據(jù)某個(gè)字段做hash分區(qū),或者隨機(jī)分布),將表中數(shù)據(jù)分布到集群的不同節(jié)點(diǎn)上。
在表中數(shù)據(jù)分布到集群的不同節(jié)點(diǎn)上,在進(jìn)行大表間的表連接操作(join操作)時(shí),如果節(jié)點(diǎn)間傳輸?shù)臄?shù)據(jù)量很大,一般通過(guò)把數(shù)據(jù)打包壓縮的方式進(jìn)行傳輸,這種方案在一定程度上減少了節(jié)點(diǎn)間數(shù)據(jù)傳輸量,但是在接收到數(shù)據(jù)后還需要解壓縮后才能進(jìn)行下一步操作,因此在內(nèi)存占用量上沒(méi)有變化;,因?yàn)閿?shù)據(jù)傳輸量變小,節(jié)點(diǎn)間數(shù)據(jù)傳輸時(shí)間變短,因此總執(zhí)行時(shí)間變短。
但是上述方案雖然使用壓縮技術(shù)減少了節(jié)點(diǎn)間數(shù)據(jù)傳輸量,但是不必要的數(shù)據(jù)量只是減少了,并沒(méi)有完全消失,同時(shí)內(nèi)存占用量并沒(méi)有減少,在數(shù)據(jù)壓縮后解壓縮占用了中央處理器(Central Processing Unit,CPU)時(shí)間,即雖然傳輸時(shí)間減少,但CPU處理時(shí)間增加,總執(zhí)行時(shí)間并沒(méi)有顯著減少。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種數(shù)據(jù)處理的方法、存儲(chǔ)節(jié)點(diǎn)及協(xié)調(diào)節(jié)點(diǎn),大大降低了表連接操作時(shí)節(jié)點(diǎn)間數(shù)據(jù)的傳輸,極大節(jié)省了網(wǎng)絡(luò)帶寬,同時(shí)減少了表連接操作的總執(zhí)行時(shí)間。
一方面,本申請(qǐng)的實(shí)施例提供一種數(shù)據(jù)處理的方法,應(yīng)用于并行計(jì)算的并行數(shù)據(jù)庫(kù)集群MPPDB,該MPPDB中可以包括多個(gè)存儲(chǔ)節(jié)點(diǎn)以及協(xié)調(diào)節(jié)點(diǎn),每個(gè)存儲(chǔ)節(jié)點(diǎn)中可以保存多個(gè)表格的數(shù)據(jù)的一部分,本申請(qǐng)實(shí)施例中,該MPPDB至少包括第一存儲(chǔ)節(jié)點(diǎn),該第一存儲(chǔ)節(jié)點(diǎn)保存了第一表格數(shù)據(jù)的一部分和第二表格數(shù)據(jù)的一部分,該方法包括:
第一存儲(chǔ)節(jié)點(diǎn)獲取客戶(hù)端設(shè)備發(fā)起的表連接操作的請(qǐng)求,該請(qǐng)求為將第一表格數(shù)據(jù)中運(yùn)算列數(shù)據(jù)和第二表格數(shù)據(jù)中運(yùn)算列數(shù)據(jù)進(jìn)行表連接操作的請(qǐng)求,運(yùn)算列數(shù)據(jù)指的是表格數(shù)據(jù)中將要進(jìn)行連接操作對(duì)應(yīng)的該行或該列數(shù)據(jù),由于行和列是相對(duì)的,行換一個(gè)方向即為列,此處用運(yùn)算列數(shù)據(jù)中的“列”不限“行”的情況;
第一存儲(chǔ)節(jié)點(diǎn)根據(jù)本地保存的第一表格數(shù)據(jù)中運(yùn)算列數(shù)據(jù)生成第一中間數(shù)據(jù),根據(jù)本地保存的第二表格數(shù)據(jù)中運(yùn)算列數(shù)據(jù)生成第二中間數(shù)據(jù),其中,第一中間數(shù)據(jù)包括所述第一表格數(shù)據(jù)中連接運(yùn)算列數(shù)據(jù)和存儲(chǔ)所述第一表格數(shù)據(jù)中非連接運(yùn)算列數(shù)據(jù)的位置信息,第二中間數(shù)據(jù)包括所述第二表格數(shù)據(jù)中連接運(yùn)算列數(shù)據(jù)和存儲(chǔ)第二表格數(shù)據(jù)中非連接運(yùn)算列數(shù)據(jù)的位置信息,此處所描述的連接運(yùn)算列數(shù)據(jù)指運(yùn)算列數(shù)據(jù)中參與連接運(yùn)算的數(shù)據(jù);
第一存儲(chǔ)節(jié)點(diǎn)獲取第二存儲(chǔ)節(jié)點(diǎn)的第三中間數(shù)據(jù)的集合,第二存儲(chǔ)節(jié)點(diǎn)包括所述MPPDB中除所述第一存儲(chǔ)節(jié)點(diǎn)外存儲(chǔ)了所述第二表格數(shù)據(jù)的所有存儲(chǔ)節(jié)點(diǎn),第三中間數(shù)據(jù)包括第二存儲(chǔ)節(jié)點(diǎn)中第二表格數(shù)據(jù)中連接運(yùn)算列數(shù)據(jù)和存儲(chǔ)第二存儲(chǔ)節(jié)點(diǎn)中第二表格數(shù)據(jù)中非連接運(yùn)算列數(shù)據(jù)的位置信息;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610173369.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:工單處理方法及裝置
- 下一篇:一種詞語(yǔ)分類(lèi)的方法及裝置
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)存儲(chǔ)管理裝置及方法
- 一種存儲(chǔ)方法、服務(wù)器及存儲(chǔ)控制器
- 一種基于存儲(chǔ)系統(tǒng)的控制方法及裝置
- 一種信息的存儲(chǔ)控制方法
- 一種數(shù)據(jù)存儲(chǔ)方法及裝置
- 數(shù)據(jù)存儲(chǔ)方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)存儲(chǔ)控制方法及裝置
- 存儲(chǔ)設(shè)備、存儲(chǔ)系統(tǒng)及存儲(chǔ)方法
- 物料存儲(chǔ)方法及系統(tǒng)
- 基于雙芯智能電表的數(shù)據(jù)分類(lèi)存儲(chǔ)方法和裝置
- 節(jié)點(diǎn)查詢(xún)方法、節(jié)點(diǎn)、移動(dòng)通訊系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品
- 一種根據(jù)節(jié)點(diǎn)集合構(gòu)造節(jié)點(diǎn)關(guān)系樹(shù)的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負(fù)載均衡裝置及虛節(jié)點(diǎn)劃分的方法
- 一種無(wú)線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點(diǎn)鎖定部件、節(jié)點(diǎn)滑軌、節(jié)點(diǎn)和機(jī)箱
- 一種待推薦節(jié)點(diǎn)線路的確定方法及裝置
- 流控方法、目標(biāo)節(jié)點(diǎn)、節(jié)點(diǎn)及施主節(jié)點(diǎn)
- 節(jié)點(diǎn)布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機(jī)構(gòu)
- 節(jié)點(diǎn)掛載方法、裝置、網(wǎng)絡(luò)節(jié)點(diǎn)及存儲(chǔ)介質(zhì)





