[發(fā)明專利]一種基于HQL的跨集群數(shù)據(jù)處理系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 202110950767.0 | 申請日: | 2021-08-18 |
| 公開(公告)號: | CN113590651B | 公開(公告)日: | 2023-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 王守明 | 申請(專利權(quán))人: | 四川新網(wǎng)銀行股份有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/27;G06F16/22 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 林菲菲 |
| 地址: | 610000 四川省成都市中國(四川)自由*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 hql 集群 數(shù)據(jù)處理系統(tǒng) 方法 | ||
本發(fā)明公開了一種基于HQL的跨集群數(shù)據(jù)處理系統(tǒng)及方法,該系統(tǒng)包括客戶端、計(jì)算引擎管理模塊、集群管理模塊、跨集群表管理模塊;客戶端,用于將待查詢的HQL語句發(fā)送到計(jì)算引擎管理模塊,同時接收查詢的結(jié)果數(shù)據(jù);計(jì)算引擎管理模塊,用于使用Hive引擎解析客戶端發(fā)送過來的HQL語句,分析出HQL中的所用到的表以及表所屬的集群,實(shí)現(xiàn)本集群或跨集群計(jì)算;集群管理模塊,用于實(shí)時地獲取所有集群的計(jì)算資源和存儲資源,并計(jì)算出當(dāng)前最空閑的集群,供計(jì)算引擎管理模塊獲取得到最空閑的集群來執(zhí)行HQL語句;跨集群表管理模塊,用于管理和維護(hù)跨集群同步過來的表。本發(fā)明解決跨集群HQL的數(shù)據(jù)計(jì)算,提升運(yùn)算速度和集群的資源利用率。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種基于HQL的跨集群數(shù)據(jù)處理系統(tǒng)及方法。
背景技術(shù)
Hive是基于Hadoop(由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu))開發(fā)的一個數(shù)據(jù)倉庫工具,可以簡單地將一個結(jié)構(gòu)化的數(shù)據(jù)映射成為數(shù)據(jù)庫中的一張表,同時還定義了簡單的SQL(結(jié)構(gòu)化查詢語言)查詢語言,稱之為HQL,Hive執(zhí)行引擎將簡單的HQL語句轉(zhuǎn)化為MapReduce(一種分布式計(jì)算系統(tǒng))任務(wù)用于分布式大數(shù)據(jù)的分析和挖掘,Map-Reduce系統(tǒng)中包含有Map(映射)單元和Reduce(歸約)單元,Map單元用于進(jìn)行數(shù)據(jù)映射,實(shí)現(xiàn)分揀和分堆,Reduce單元進(jìn)行數(shù)據(jù)合并。HQL的出現(xiàn)極大地降低了數(shù)倉分析人員的學(xué)習(xí)成本,對數(shù)據(jù)分析發(fā)揮著重要的作用。
然而隨著業(yè)務(wù)的發(fā)展,往往數(shù)據(jù)分布在不同的集群上,由于HQL只能在單集群下的數(shù)據(jù)分析,在這種跨集群的場景下,HQL將不能發(fā)揮優(yōu)勢,現(xiàn)有的技術(shù)方案就是由集群運(yùn)維人員將數(shù)據(jù)同步到同一集群,并將數(shù)據(jù)映射成一張Hive表,這樣不僅費(fèi)事費(fèi)力,不利于數(shù)倉分析人員對數(shù)據(jù)的快速分析,同時也增加了對數(shù)據(jù)的維護(hù)成本。
發(fā)明內(nèi)容
本發(fā)明目的在于提供一種基于HQL的跨集群數(shù)據(jù)處理系統(tǒng)及方法,解決跨集群HQL的數(shù)據(jù)計(jì)算、處理;本發(fā)明通過該系統(tǒng),數(shù)倉分析人員將較好地利用HQL便利性來實(shí)現(xiàn)多個集群的數(shù)據(jù)分析,同時也減少了運(yùn)維人員對數(shù)據(jù)的維護(hù)成本。
本發(fā)明通過下述技術(shù)方案實(shí)現(xiàn):
第一方面,本發(fā)明提供了一種基于HQL的跨集群數(shù)據(jù)處理系統(tǒng),該系統(tǒng)包括客戶端、計(jì)算引擎管理模塊、集群管理模塊、跨集群表管理模塊;
所述客戶端,用于將待查詢的HQL語句發(fā)送到計(jì)算引擎管理模塊,同時接收所述計(jì)算引擎管理模塊查詢的結(jié)果數(shù)據(jù);
所述計(jì)算引擎管理模塊,用于使用Hive引擎解析客戶端發(fā)送過來的HQL語句,分析出HQL中的所用到的表、以及表所屬的集群(可能是本集群,也可能是非本集群),實(shí)現(xiàn)本集群或跨集群計(jì)算;同時該模塊支持跨集群HQL的語法檢查;
所述集群管理模塊,用于實(shí)時地獲取所有集群的計(jì)算資源和存儲資源,并計(jì)算出當(dāng)前最空閑的集群,供所述計(jì)算引擎管理模塊獲取得到最空閑的集群來執(zhí)行HQL語句;
所述跨集群表管理模塊,用于管理和維護(hù)這些跨集群同步過來的表,即管理由非本集群同步到本集群的表;該模塊默認(rèn)是開啟自動清除同步過來的表,如果關(guān)閉,將通過該模塊實(shí)現(xiàn)手動刪除。
進(jìn)一步地,考慮到本系統(tǒng)的設(shè)計(jì)目標(biāo)為滿足多集群的HQL計(jì)算,需要對集群的一些配置屬性信息需要維護(hù)管理,即所述集群管理模塊還用于對集群的配置屬性信息進(jìn)行維護(hù)管理。所述集群的配置屬性信息包括集群名稱(HQL語句中的表名稱會使用該屬性)、集群yarn地址信息、集群HiveThriftServcer地址信息和集群hdfs的地址信息;獲取這些信息主要目的是選擇一個最空閑的集群,將最終由計(jì)算引擎管理模塊解析后的HQL語句,提交到該集群,以提升集群的利用率和任務(wù)的運(yùn)算效率。其中:
(1)集群名稱:HQL中的表名稱會使用,表名稱的約定的規(guī)則為:[集群名稱.數(shù)據(jù)庫名稱.表名稱];
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川新網(wǎng)銀行股份有限公司,未經(jīng)四川新網(wǎng)銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110950767.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種海量數(shù)據(jù)處理方法和系統(tǒng)
- 數(shù)據(jù)查詢方法、裝置及系統(tǒng)
- 一種基于Java EJB平臺的實(shí)體BEAN通用查詢方法
- 失敗任務(wù)的影響及溯源分析方法、裝置、設(shè)備及存儲介質(zhì)
- 伯克氏菌HQL1813及其分離篩選方法和應(yīng)用
- 一種快速響應(yīng)數(shù)據(jù)查詢請求的方法和系統(tǒng)
- 一種基于HQL語句的Shell腳本依賴關(guān)系抽取方法
- 基于大數(shù)據(jù)平臺的SQL語句轉(zhuǎn)換方法、裝置和計(jì)算機(jī)設(shè)備
- 邏輯腳本的處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- HQL腳本校驗(yàn)方法及裝置
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點(diǎn)和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲介質(zhì)
- 在數(shù)據(jù)處理系統(tǒng)中基于所需電池壽命的計(jì)算機(jī)電源管理
- 在網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)中安裝軟件的方法和系統(tǒng)
- 遠(yuǎn)程數(shù)據(jù)處理系統(tǒng)的配置
- 多個子據(jù)處理系統(tǒng)之間在線切換的方法
- 跨境多幣種數(shù)據(jù)處理系統(tǒng)和方法
- 用于批量和實(shí)時數(shù)據(jù)處理的設(shè)備、系統(tǒng)和方法
- 動態(tài)地調(diào)整品牌和平臺界面元素
- 基于銀行卡交易的數(shù)據(jù)處理方法以及數(shù)據(jù)處理系統(tǒng)
- 數(shù)據(jù)處理方法、裝置和設(shè)備
- 用于批量和實(shí)時數(shù)據(jù)處理的設(shè)備、系統(tǒng)和方法





