[發(fā)明專利]基于ETL的輕量化自定義源數(shù)據(jù)分解讀取系統(tǒng)和方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811345080.9 | 申請(qǐng)日: | 2018-11-13 |
| 公開(kāi)(公告)號(hào): | CN109635023B | 公開(kāi)(公告)日: | 2021-01-15 |
| 發(fā)明(設(shè)計(jì))人: | 顏文德;徐明;葉祖鋒;王華松 | 申請(qǐng)(專利權(quán))人: | 廣州歐賽斯信息科技有限公司 |
| 主分類號(hào): | G06F16/25 | 分類號(hào): | G06F16/25;G06F16/215;G06F16/28;G06F16/2458 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 胡輝 |
| 地址: | 510000 廣東省廣州市高新技術(shù)產(chǎn)業(yè)開(kāi)發(fā)*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 etl 量化 自定義 數(shù)據(jù) 分解 讀取 系統(tǒng) 方法 | ||
1.一種基于ETL的輕量化自定義源數(shù)據(jù)分解讀取系統(tǒng),其特征在于:包括:
源數(shù)據(jù)庫(kù),用于存儲(chǔ)原始數(shù)據(jù);
第一至第N自定義ETL工具,用于對(duì)源數(shù)據(jù)庫(kù)中的第一至第N自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù)進(jìn)行清洗和統(tǒng)計(jì),然后將經(jīng)過(guò)清洗的數(shù)據(jù)和統(tǒng)計(jì)結(jié)果存入數(shù)據(jù)倉(cāng)庫(kù);N大于等于2;
數(shù)據(jù)倉(cāng)庫(kù),用于存儲(chǔ)經(jīng)過(guò)數(shù)據(jù)清洗的數(shù)據(jù)和統(tǒng)計(jì)結(jié)果,以及為數(shù)據(jù)分析系統(tǒng)提供經(jīng)過(guò)清洗的數(shù)據(jù)和/或統(tǒng)計(jì)結(jié)果;
所述原始數(shù)據(jù)包括系統(tǒng)自動(dòng)采集的表格數(shù)據(jù)和人工輸入的數(shù)據(jù);
所述數(shù)據(jù)倉(cāng)庫(kù)包括數(shù)據(jù)型的數(shù)據(jù)倉(cāng)庫(kù)和統(tǒng)計(jì)型的數(shù)據(jù)倉(cāng)庫(kù);所述數(shù)據(jù)型的數(shù)據(jù)倉(cāng)庫(kù)用于存儲(chǔ)經(jīng)過(guò)清洗的數(shù)據(jù),所述統(tǒng)計(jì)型的數(shù)據(jù)倉(cāng)庫(kù)用于存儲(chǔ)數(shù)據(jù)的統(tǒng)計(jì)結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于ETL的輕量化自定義源數(shù)據(jù)分解讀取系統(tǒng),其特征在于:所述對(duì)源數(shù)據(jù)庫(kù)中的第一至第N自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù)進(jìn)行清洗和統(tǒng)計(jì),其具體包括:
第X自定義ETL工具在源數(shù)據(jù)庫(kù)中抽取第X自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù);其中,X∈[1,N];
第X自定義ETL工具根據(jù)其設(shè)定處理規(guī)則,對(duì)抽取出來(lái)的第X自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和統(tǒng)計(jì)。
3.一種基于ETL的輕量化自定義源數(shù)據(jù)分解讀取方法,其特征在于:包括以下步驟:
獲取原始數(shù)據(jù),將原始數(shù)據(jù)存入源數(shù)據(jù)庫(kù)中;
調(diào)用第一至第N自定義ETL工具對(duì)源數(shù)據(jù)庫(kù)中的第一至第N自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù)進(jìn)行清洗和統(tǒng)計(jì);
將經(jīng)過(guò)數(shù)據(jù)清洗的數(shù)據(jù)和統(tǒng)計(jì)結(jié)果存儲(chǔ)至數(shù)據(jù)倉(cāng)庫(kù);
所述原始數(shù)據(jù)包括系統(tǒng)自動(dòng)采集的表格數(shù)據(jù)和人工輸入的數(shù)據(jù);
所述數(shù)據(jù)倉(cāng)庫(kù)包括數(shù)據(jù)型的數(shù)據(jù)倉(cāng)庫(kù)和統(tǒng)計(jì)型的數(shù)據(jù)倉(cāng)庫(kù);所述數(shù)據(jù)型的數(shù)據(jù)倉(cāng)庫(kù)用于存儲(chǔ)經(jīng)過(guò)清洗的數(shù)據(jù),所述統(tǒng)計(jì)型的數(shù)據(jù)倉(cāng)庫(kù)用于存儲(chǔ)數(shù)據(jù)的統(tǒng)計(jì)結(jié)果。
4.根據(jù)權(quán)利要求3所述的一種基于ETL的輕量化自定義源數(shù)據(jù)分解讀取方法,其特征在于:還包括以下步驟:
獲取數(shù)據(jù)分析系統(tǒng)的請(qǐng)求;
根據(jù)數(shù)據(jù)分析系統(tǒng)的請(qǐng)求,提供經(jīng)過(guò)數(shù)據(jù)清洗的數(shù)據(jù)和統(tǒng)計(jì)結(jié)果。
5.根據(jù)權(quán)利要求3所述的一種基于ETL的輕量化自定義源數(shù)據(jù)分解讀取方法,其特征在于:所述對(duì)源數(shù)據(jù)庫(kù)中的第一至第N自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù)進(jìn)行清洗和統(tǒng)計(jì),其具體包括:
第X自定義ETL工具在源數(shù)據(jù)庫(kù)中抽取第X自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù);其中,X∈[1,N];
第X自定義ETL工具根據(jù)其設(shè)定處理規(guī)則,對(duì)抽取出來(lái)的第X自定義內(nèi)容對(duì)應(yīng)的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和統(tǒng)計(jì)。
6.一種基于ETL的輕量化自定義源數(shù)據(jù)分解讀取系統(tǒng),其特征在于:包括:
存儲(chǔ)器,用于存儲(chǔ)程序;
處理器,用于加載所述程序以執(zhí)行如權(quán)利要求3-5任一項(xiàng)所述的輕量化自定義ETL的數(shù)據(jù)處理方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州歐賽斯信息科技有限公司,未經(jīng)廣州歐賽斯信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811345080.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)抽取、轉(zhuǎn)換和加載的執(zhí)行方法和裝置
- 為ETL任務(wù)分配節(jié)點(diǎn)的方法和調(diào)度系統(tǒng)
- 一種用于調(diào)度ETL任務(wù)的方法與設(shè)備
- 一種基于元數(shù)據(jù)的ETL實(shí)現(xiàn)方法及系統(tǒng)
- 一種監(jiān)控任務(wù)運(yùn)行的方法和設(shè)備
- 一種分布式數(shù)據(jù)ETL處理方法及裝置
- 一種基于多服務(wù)節(jié)點(diǎn)的數(shù)據(jù)處理系統(tǒng)及其方法
- ETL任務(wù)調(diào)度方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于元數(shù)據(jù)的ETL任務(wù)批量生成方法
- ETL文件拆分方法及裝置
- 基于位平面的不等長(zhǎng)的量化/反量化方法
- 反量化圖像的方法和設(shè)備以及解碼圖像的方法和設(shè)備
- 量化處理方法及裝置
- 用于對(duì)線性預(yù)測(cè)系數(shù)進(jìn)行量化的方法和裝置及用于反量化的方法和裝置
- 量化開(kāi)發(fā)人員代碼質(zhì)量的方法和裝置
- 一種圖像云儲(chǔ)存設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)權(quán)重量化方法和神經(jīng)網(wǎng)絡(luò)權(quán)重量化裝置
- 量化器與量化方法
- 編碼方法及其設(shè)備以及解碼方法及其設(shè)備
- 量化參數(shù)處理方法及裝置
- 一種自定義命令控制方法、裝置及注塑機(jī)系統(tǒng)
- 一種公式自定義方法及使用自定義公式的方法
- 一種報(bào)表系統(tǒng)自定義函數(shù)的實(shí)現(xiàn)方法
- 用于混淆虛擬機(jī)上的應(yīng)用程序的執(zhí)行的方法、裝置以及計(jì)算機(jī)可讀介質(zhì)
- 一種自定義腳本繪制終端及方法
- 添加自定義分詞的方法及裝置
- 用戶配置的且自定義的交互式對(duì)話應(yīng)用
- 一種應(yīng)用于晾衣機(jī)的自定義遙控系統(tǒng)及其設(shè)置方法
- 一種自定義住房單元
- 一種自定義文檔頁(yè)面生成方法及相關(guān)設(shè)備





