[發(fā)明專利]一種數(shù)據(jù)清洗方法和數(shù)據(jù)清洗系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810143012.8 | 申請日: | 2018-02-11 |
| 公開(公告)號: | CN108363782A | 公開(公告)日: | 2018-08-03 |
| 發(fā)明(設(shè)計)人: | 博格利;賈子翔;龍岳;蔣成;郭佳睿 | 申請(專利權(quán))人: | 中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F9/451 |
| 代理公司: | 北京天昊聯(lián)合知識產(chǎn)權(quán)代理有限公司 11112 | 代理人: | 彭瑞欣;羅瑞芝 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)清洗 圖形化界面 清洗 異構(gòu)數(shù)據(jù)源 數(shù)據(jù)源 數(shù)據(jù)清洗系統(tǒng) 大數(shù)據(jù) 文本文件 數(shù)據(jù)庫數(shù)據(jù) 編輯數(shù)據(jù) 技術(shù)門檻 應(yīng)用服務(wù) 圖形化 融合 開發(fā) 服務(wù) | ||
1.一種數(shù)據(jù)清洗方法,其特征在于,包括:
步驟S10:通過圖形化界面從異構(gòu)數(shù)據(jù)源中選定待清洗的數(shù)據(jù)源;其中,所述異構(gòu)數(shù)據(jù)源包括文本文件和數(shù)據(jù)庫數(shù)據(jù);
步驟S11:通過所述圖形化界面編輯數(shù)據(jù)清洗規(guī)則;
步驟S12:通過所述圖形化界面執(zhí)行數(shù)據(jù)清洗。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)清洗方法,其特征在于,所述步驟S11包括:
步驟S110:通過所述圖形化界面從選定的所述待清洗的數(shù)據(jù)源中選擇待清洗文件;
步驟S111:通過所述圖形化界面指定所述待清洗文件中的待清洗字段;
步驟S112:通過所述圖形化界面對所述待清洗字段配置清洗規(guī)則。
3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)清洗方法,其特征在于,所述步驟S12還包括:向所述圖形化界面反饋數(shù)據(jù)清洗的運(yùn)行日志信息。
4.根據(jù)權(quán)利要求1或3所述的數(shù)據(jù)清洗方法,其特征在于,在所述步驟S11之后和所述步驟S12之前還包括:
步驟S11′:通過所述圖形化界面指定清洗好的結(jié)果文件的輸出路徑;
在所述步驟S12之后還包括:
步驟S13:通過所述圖形化界面查看指定的所述輸出路徑下的所述結(jié)果文件。
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)清洗方法,其特征在于,在所述步驟S13之后還包括:
步驟S14:通過所述圖形化界面選擇執(zhí)行所述結(jié)果文件的入庫操作。
6.一種數(shù)據(jù)清洗系統(tǒng),其特征在于,包括:
選擇模塊,用于通過圖形化界面從異構(gòu)數(shù)據(jù)源中選定待清洗的數(shù)據(jù)源;其中,所述異構(gòu)數(shù)據(jù)源包括文本文件和數(shù)據(jù)庫數(shù)據(jù);
編輯模塊,用于通過所述圖形化界面編輯數(shù)據(jù)清洗規(guī)則;
清洗模塊,用于通過所述圖形化界面執(zhí)行數(shù)據(jù)清洗。
7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)清洗系統(tǒng),其特征在于,所述編輯模塊包括:
第一選擇單元,用于通過所述圖形化界面從選定的所述待清洗的數(shù)據(jù)源中選擇待清洗文件;
第二選擇單元,用于通過所述圖形化界面指定所述待清洗文件中的待清洗字段;
配置單元,用于通過所述圖形化界面對所述待清洗字段配置清洗規(guī)則。
8.根據(jù)權(quán)利要求6所述的數(shù)據(jù)清洗系統(tǒng),其特征在于,還包括反饋模塊,用于向所述圖形化界面反饋數(shù)據(jù)清洗的運(yùn)行日志信息。
9.根據(jù)權(quán)利要求6或8所述的數(shù)據(jù)清洗系統(tǒng),其特征在于,還包括指定模塊,用于通過所述圖形化界面指定清洗好的結(jié)果文件的輸出路徑;
查看模塊,用于通過所述圖形化界面查看指定的所述輸出路徑下的所述結(jié)果文件。
10.根據(jù)權(quán)利要求9所述的數(shù)據(jù)清洗系統(tǒng),其特征在于,還包括入庫模塊,用于通過所述圖形化界面選擇執(zhí)行所述結(jié)果文件的入庫操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,未經(jīng)中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810143012.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)清洗系統(tǒng)和數(shù)據(jù)清洗方法
- 數(shù)據(jù)清洗方法及數(shù)據(jù)清洗裝置
- 一種數(shù)據(jù)清洗的方法及用于數(shù)據(jù)清洗的裝置
- 一種數(shù)據(jù)清洗方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 數(shù)據(jù)清洗方法、裝置、設(shè)備和存儲介質(zhì)
- 一種數(shù)據(jù)清洗方法及裝置
- 一種快速運(yùn)行的大數(shù)據(jù)清洗方法
- 數(shù)據(jù)清洗方法及裝置
- 一種數(shù)據(jù)清洗方法、系統(tǒng)、數(shù)據(jù)清洗設(shè)備和可讀存儲介質(zhì)
- 一種數(shù)據(jù)清洗方法和裝置
- 一種GIS中間件配置管理方法
- 一種異構(gòu)數(shù)據(jù)源數(shù)據(jù)查詢方法及裝置
- 一種基于開放接口的多源異構(gòu)數(shù)據(jù)源訪問方法
- 一種同步異構(gòu)數(shù)據(jù)庫系統(tǒng)中實時數(shù)據(jù)的方法
- 一種異構(gòu)數(shù)據(jù)集成平臺
- 融合數(shù)據(jù)處理方法及裝置
- 多源異構(gòu)的數(shù)據(jù)關(guān)聯(lián)查詢方法及系統(tǒng)
- 面向多個異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)關(guān)聯(lián)分析方法
- 異構(gòu)數(shù)據(jù)處理方法、裝置、電子設(shè)備和可讀存儲介質(zhì)
- 一種多源異構(gòu)數(shù)據(jù)的描述方法、解析方法及裝置





