[發(fā)明專利]一種數(shù)據(jù)處理方法、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201811646447.0 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109739828B | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設(shè)計(jì))人: | 李宗祥;嚴(yán)國友;孫一波;張文啟 | 申請(專利權(quán))人: | 咪咕文化科技有限公司 |
| 主分類號: | G06F16/182 | 分類號: | G06F16/182;G06F16/2458;G06F16/27 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 姚文嫻;張穎玲 |
| 地址: | 100032 北京市西城區(qū)德*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù)處理 方法 設(shè)備 計(jì)算機(jī) 可讀 存儲 介質(zhì) | ||
1.一種數(shù)據(jù)處理方法,其特征在于,所示方法包括:
設(shè)置Hive表的分區(qū),并設(shè)置Hive對應(yīng)的分布式文件系統(tǒng)HDFS的主節(jié)點(diǎn)中存儲待處理數(shù)據(jù)的元數(shù)據(jù)的存儲方式為第一存儲方式;其中,所述第一存儲方式包括按照所述待處理數(shù)據(jù)的屬性存儲的方式;
設(shè)置所述HDFS的數(shù)據(jù)節(jié)點(diǎn)中存儲所述待處理數(shù)據(jù)的存儲方式為第二存儲方式;其中,所述第二存儲方式包括按照所述待處理數(shù)據(jù)的屬性字段存儲的方式;
建立所述Hive、所述主節(jié)點(diǎn)和所述數(shù)據(jù)節(jié)點(diǎn)之間的映射關(guān)系,并基于所述映射關(guān)系設(shè)置鍵值信息;其中,所述鍵值信息存儲在所述主節(jié)點(diǎn)中;
按照所述第一存儲方式和所述第二存儲方式,并基于所述鍵值信息對所述待處理數(shù)據(jù)執(zhí)行預(yù)定處理;
其中,所述按照所述第一存儲方式和所述第二存儲方式,并基于所述鍵值信息對所述待處理數(shù)據(jù)執(zhí)行預(yù)定處理,包括:
獲取所述待處理數(shù)據(jù),并將所述待處理數(shù)據(jù)錄入分區(qū)后的所述Hive表中;
按照所述待處理數(shù)據(jù)的屬性將所述待處理數(shù)據(jù)進(jìn)行第一分類,并基于所述鍵值信息將進(jìn)行第一分類后的所述待處理數(shù)據(jù)對應(yīng)的元數(shù)據(jù)存儲在所述主節(jié)點(diǎn)中;
按照所述待處理數(shù)據(jù)的屬性字段對所述待處理數(shù)據(jù)進(jìn)行第二分類,并基于所述鍵值信息將進(jìn)行第二分類后的所述待處理數(shù)據(jù)存儲在所述數(shù)據(jù)節(jié)點(diǎn)中。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
所述數(shù)據(jù)節(jié)點(diǎn)的每個數(shù)據(jù)塊中存儲有同一屬性字段對應(yīng)的同一類別的待處理數(shù)據(jù);
所述主節(jié)點(diǎn)的每個文件中存儲有同一屬性對應(yīng)的同一類別的待處理數(shù)據(jù)的元數(shù)據(jù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述建立所述Hive、所述主節(jié)點(diǎn)和所述數(shù)據(jù)節(jié)點(diǎn)之間的映射關(guān)系,并基于所述映射關(guān)系設(shè)置鍵值信息,包括:
建立所述Hive表中的每個分區(qū)與所述主節(jié)點(diǎn)中的文件之間的第一映射關(guān)系;
建立所述主節(jié)點(diǎn)中的文件與所述數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)塊之間的第二映射關(guān)系;
基于所述第一映射關(guān)系、所述第二映射關(guān)系和所述元數(shù)據(jù),設(shè)置所述鍵值信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述第一映射關(guān)系、所述第二映射關(guān)系和所述元數(shù)據(jù),設(shè)置所述鍵值信息,包括:
確定所述Hive表中的每個分區(qū)的標(biāo)識,并基于所述第一映射關(guān)系確定每個分區(qū)對應(yīng)的所述屬性字段的信息;
基于所述第一映射關(guān)系和每個所述分區(qū)的標(biāo)識,設(shè)置所述鍵值信息中的鍵;
確定所述主節(jié)點(diǎn)中的每個文件對應(yīng)的屬性字段序列;
基于所述第二映射關(guān)系和所述屬性字段序列,設(shè)置所述鍵值信息中的值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照所述待處理數(shù)據(jù)的屬性將所述待處理數(shù)據(jù)進(jìn)行第一分類,并基于所述鍵值信息將進(jìn)行第一分類后的所述待處理數(shù)據(jù)對應(yīng)的元數(shù)據(jù)存儲在所述主節(jié)點(diǎn)中,包括:
獲取所述待處理數(shù)據(jù)的屬性,并基于所述屬性對所述待處理數(shù)據(jù)進(jìn)行第一分類;
按照每一第一分類的待處理數(shù)據(jù)的元數(shù)據(jù)存儲在一個文件的存儲關(guān)系,并基于所述鍵值信息將所述元數(shù)據(jù)存儲在所述主節(jié)點(diǎn)中。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照所述待處理數(shù)據(jù)的屬性字段對所述待處理數(shù)據(jù)進(jìn)行第二分類,并基于所述鍵值信息將進(jìn)行第二分類后的所述待處理數(shù)據(jù)存儲在所述數(shù)據(jù)節(jié)點(diǎn)中,包括:
獲取所述待處理數(shù)據(jù)的屬性字段的值,并基于所述待處理數(shù)據(jù)的屬性字段的值對所述待處理數(shù)據(jù)進(jìn)行第二分類;
基于所述鍵值信息采用列存儲方式,并按照每一第二分類的待處理數(shù)據(jù)存儲在數(shù)據(jù)節(jié)點(diǎn)的一個數(shù)據(jù)塊的存儲關(guān)系,將進(jìn)行第二分類后的所述待處理數(shù)據(jù)存儲在所述數(shù)據(jù)節(jié)點(diǎn)中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于咪咕文化科技有限公司,未經(jīng)咪咕文化科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811646447.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)
- 雙桌面遠(yuǎn)程控制系統(tǒng)及方法
- 一種基于網(wǎng)絡(luò)的計(jì)算機(jī)信息檢索系統(tǒng)與方法
- 一種基于網(wǎng)絡(luò)的計(jì)算機(jī)信息檢索系統(tǒng)與方法
- 一種基于網(wǎng)絡(luò)的計(jì)算機(jī)信息檢索系統(tǒng)與方法
- 雙計(jì)算機(jī)系統(tǒng)
- 制導(dǎo)雷達(dá)計(jì)算機(jī)系統(tǒng)
- 一種服務(wù)部署方法及裝置
- 一種計(jì)算機(jī)集成系統(tǒng)及故障自動切換方法
- 一種計(jì)算機(jī)信息安全監(jiān)控系統(tǒng)
- 混合型量子計(jì)算機(jī)架構(gòu)及其執(zhí)行計(jì)算任務(wù)的方法





