日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]支持接口適配的海量多源異構(gòu)數(shù)據(jù)ETL方法及系統(tǒng)在審

專利信息
申請(qǐng)?zhí)枺?/td> 201810588231.7 申請(qǐng)日: 2018-06-08
公開(公告)號(hào): CN108846076A 公開(公告)日: 2018-11-20
發(fā)明(設(shè)計(jì))人: 史玉良;王新軍;張暉;管永明;呂梁;劉智勇 申請(qǐng)(專利權(quán))人: 山大地緯軟件股份有限公司
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 37221 代理人: 黃海麗
地址: 250101 山東省濟(jì)南*** 國(guó)省代碼: 山東;37
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 多源異構(gòu)數(shù)據(jù) 目標(biāo)數(shù)據(jù)庫(kù) 接口適配 轉(zhuǎn)換 匹配 抽取 數(shù)據(jù)模型定義 數(shù)據(jù)轉(zhuǎn)換步驟 參數(shù)設(shè)置 調(diào)度管理 海量數(shù)據(jù) 緩沖存儲(chǔ) 基本信息 監(jiān)控管理 控制執(zhí)行 設(shè)置數(shù)據(jù) 數(shù)據(jù)抽取 數(shù)據(jù)對(duì)象 數(shù)據(jù)更新 數(shù)據(jù)加載 數(shù)據(jù)監(jiān)控 系統(tǒng)運(yùn)行 作業(yè)資源 表結(jié)構(gòu) 自適應(yīng) 質(zhì)量檢查 加載 清洗 核查 輸出 管理
【說(shuō)明書】:

發(fā)明公開了支持接口適配的海量多源異構(gòu)數(shù)據(jù)ETL方法及系統(tǒng)。包括:數(shù)據(jù)抽取步驟,設(shè)置數(shù)據(jù)源和目標(biāo)數(shù)據(jù)庫(kù)的基本信息,為不同數(shù)據(jù)源自適應(yīng)地匹配相應(yīng)的ETL工具,并對(duì)ETL工具進(jìn)行參數(shù)設(shè)置;數(shù)據(jù)轉(zhuǎn)換步驟,完成ETL作業(yè)控制執(zhí)行和調(diào)度管理,對(duì)所抽取的數(shù)據(jù)進(jìn)行緩沖存儲(chǔ)和管理,并完成數(shù)據(jù)的清洗和轉(zhuǎn)換等處理;數(shù)據(jù)加載步驟,將經(jīng)過(guò)轉(zhuǎn)換后的數(shù)據(jù)對(duì)象進(jìn)行質(zhì)量檢查,并按照數(shù)據(jù)模型定義的表結(jié)構(gòu)輸出,將核查無(wú)誤后的數(shù)據(jù)更新加載至目標(biāo)數(shù)據(jù)庫(kù)中;數(shù)據(jù)監(jiān)控步驟,對(duì)ETL作業(yè)執(zhí)行過(guò)程、作業(yè)資源使用情況及系統(tǒng)運(yùn)行情況進(jìn)行監(jiān)控管理。自適應(yīng)地匹配合適的ETL工具,并實(shí)現(xiàn)海量數(shù)據(jù)的抽取與轉(zhuǎn)換,實(shí)現(xiàn)ETL作業(yè)的高效執(zhí)行和有序管理。

技術(shù)領(lǐng)域

本發(fā)明涉及ETL管理領(lǐng)域,特別涉及一種支持接口適配的海量多源異構(gòu)數(shù)據(jù)ETL方法及系統(tǒng)。

背景技術(shù)

目前行業(yè)積累了大量數(shù)據(jù),數(shù)據(jù)的容量、種類和變化都在急劇增加,但大數(shù)據(jù)尚未充分利用,其中蘊(yùn)藏的巨大價(jià)值有待挖掘。大數(shù)據(jù)往往具有多源異構(gòu)特性,來(lái)自不同的、分散的業(yè)務(wù)系統(tǒng),存在結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)等多種類型,難以抽取并轉(zhuǎn)換成所需的數(shù)據(jù)。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)呈現(xiàn)出大容量、多樣式、交互頻繁等特征,隨著采集數(shù)據(jù)的不斷增加,數(shù)據(jù)處理邏輯逐漸復(fù)雜,并且面臨著海量多源異構(gòu)數(shù)據(jù)在不同數(shù)據(jù)庫(kù)之間傳輸效率問題。

傳統(tǒng)的ETL工具價(jià)格昂貴,對(duì)具體的業(yè)務(wù)依賴性很高,且為集中式架構(gòu),即設(shè)計(jì)、運(yùn)行管理都集中在一臺(tái)服務(wù)器上,對(duì)硬件的要求非常高。在傳統(tǒng)ETL管理模式下,一般根據(jù)源數(shù)據(jù)庫(kù)與目標(biāo)數(shù)據(jù)庫(kù)的屬性,人工判定ETL工具,并設(shè)置ETL任務(wù)流程、設(shè)置參數(shù)、啟動(dòng)任務(wù),此種人工ETL管理模式流程復(fù)雜,消耗大量的人力和時(shí)間,且無(wú)法滿足海量多源異構(gòu)數(shù)據(jù)的ETL作業(yè)需求。因此需要探索在大數(shù)據(jù)環(huán)境下能夠更經(jīng)濟(jì)、更高效地執(zhí)行ETL(抽取、轉(zhuǎn)換、加載)操作的裝置。

發(fā)明內(nèi)容

本發(fā)明的目的就是為解決上述問題,提出了一種支持接口適配的海量多源異構(gòu)數(shù)據(jù)ETL方法及系統(tǒng),針對(duì)來(lái)自不同、分散的系統(tǒng)的海量多源異構(gòu)數(shù)據(jù),基于接口適配器和ETL工具引擎自適應(yīng)地選擇合適的ETL工具,并基于HDFS、MapReduce、Spark等大數(shù)據(jù)處理技術(shù)實(shí)現(xiàn)ETL作業(yè)調(diào)度管理與高效執(zhí)行,以及海量復(fù)雜數(shù)據(jù)的集中存儲(chǔ)與處理轉(zhuǎn)換。

為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:

作為本發(fā)明的第一方面,提供了支持接口適配的海量多源異構(gòu)數(shù)據(jù)ETL方法;

支持接口適配的海量多源異構(gòu)數(shù)據(jù)ETL方法,包括:

數(shù)據(jù)抽取步驟,設(shè)置數(shù)據(jù)源和目標(biāo)數(shù)據(jù)庫(kù)的基本信息,為不同數(shù)據(jù)源自適應(yīng)地匹配相應(yīng)的ETL工具,并對(duì)ETL工具進(jìn)行參數(shù)設(shè)置;通過(guò)數(shù)據(jù)庫(kù)接口、日志文件接口或流數(shù)據(jù)接口抽取不同的數(shù)據(jù)源;

數(shù)據(jù)轉(zhuǎn)換步驟,基于MapReduce及Spark計(jì)算框架完成ETL作業(yè)控制執(zhí)行和調(diào)度管理,基于HDFS、Hive或HBase對(duì)所抽取的數(shù)據(jù)進(jìn)行緩沖存儲(chǔ)和管理,并完成數(shù)據(jù)的清洗和轉(zhuǎn)換;

數(shù)據(jù)加載步驟,將經(jīng)過(guò)轉(zhuǎn)換后的數(shù)據(jù)對(duì)象進(jìn)行質(zhì)量檢查,并按照數(shù)據(jù)模型定義的表結(jié)構(gòu)輸出,將核查無(wú)誤后的數(shù)據(jù)更新加載至目標(biāo)數(shù)據(jù)庫(kù)中;

監(jiān)控管理步驟,對(duì)ETL作業(yè)執(zhí)行過(guò)程、作業(yè)資源使用情況及系統(tǒng)運(yùn)行情況進(jìn)行監(jiān)控管理。

作為本發(fā)明的進(jìn)一步改進(jìn),所述數(shù)據(jù)抽取步驟,包括:

設(shè)置數(shù)據(jù)源及目標(biāo)庫(kù)子步驟,設(shè)置數(shù)據(jù)源和目標(biāo)數(shù)據(jù)庫(kù)的基本信息,包括:數(shù)據(jù)庫(kù)類型、數(shù)據(jù)源與目標(biāo)數(shù)據(jù)庫(kù)之間的連接類型、數(shù)據(jù)庫(kù)IP、數(shù)據(jù)庫(kù)名稱、端口、用戶名、密碼;

自適應(yīng)匹配ETL工具子步驟,為不同的數(shù)據(jù)源自適應(yīng)的匹配對(duì)應(yīng)的ETL工具。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山大地緯軟件股份有限公司,未經(jīng)山大地緯軟件股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810588231.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美精品乱码视频一二专区| 欧美日韩一区二区三区在线播放 | 亚洲乱强伦| 亚洲免费永久精品国产| 国产精品亚洲а∨天堂123bt| 天干天干天干夜夜爽av| 狠狠色噜噜狠狠狠狠黑人| 麻豆精品国产入口| 大伊人av| 日韩在线一区视频| 国产二区不卡| 国内精品国产三级国产99| 欧美一区二区三区免费观看视频| 99热一区二区| 91精品啪在线观看国产手机| 亚洲精品少妇一区二区| 久久精品国产99| 一区二区三区国产精品视频| 欧美福利一区二区| 一区二区在线精品| 91精品国产综合久久福利软件| 日本伦精品一区二区三区免费| 免费高潮又黄又色又爽视频| 色噜噜狠狠色综合中文字幕| 欧美日韩国产一级| 久久影院国产精品| 91精品国产91热久久久做人人| 中文字幕一级二级三级| 精品少妇一区二区三区 | 亚洲国产另类久久久精品性| 欧美3p激情一区二区三区猛视频| 国产区二区| 精品美女一区二区三区| 一级黄色片免费网站| 国产在线观看二区| 制服丝袜亚洲一区| av午夜剧场| 91免费国产视频| 日韩av三区| 国产精品一区二区日韩新区| 国产精品入口麻豆九色| 国产第一区在线观看| 韩国女主播一区二区| 久久99精品久久久噜噜最新章节| 国产91丝袜在线播放动漫| 国产精品videossex国产高清| 二区三区视频| 国产国产精品久久久久| 国产精品丝袜综合区另类| 精品免费久久久久久久苍| 蜜臀久久99精品久久久| 国产亚洲欧美日韩电影网| 婷婷嫩草国产精品一区二区三区| 欧美高清性xxxxhd| 亚洲日韩欧美综合| 国产精品不卡在线| 欧美午夜一区二区三区精美视频| 亚洲无人区码一码二码三码 | 国产韩国精品一区二区三区| 国产精品亚洲第一区| 狠狠色丁香久久综合频道日韩| 午夜特片网| 久久综合国产精品| 中文字幕视频一区二区| 免费毛片**| 国产视频一区二区视频| 欧美日韩国产影院| 26uuu色噜噜精品一区二区| 91精品一二区| 欧美性受xxxx狂喷水| 欧美日韩精品在线一区二区| 国产麻豆一区二区三区精品| 亚洲高清乱码午夜电影网| 久免费看少妇高潮a级特黄按摩 | 久久久久久久久亚洲精品| 四季av中文字幕一区| 国产欧美一区二区三区在线看| 国产精品女人精品久久久天天| 国产一卡二卡在线播放| xxxx18hd护士hd护士| 欧美人妖一区二区三区| 精品福利一区二区|