日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]數(shù)據(jù)清理方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 201910308949.0 申請(qǐng)日: 2019-04-17
公開(公告)號(hào): CN110162519A 公開(公告)日: 2019-08-23
發(fā)明(設(shè)計(jì))人: 張禮成 申請(qǐng)(專利權(quán))人: 蘇寧易購(gòu)集團(tuán)股份有限公司
主分類號(hào): G06F16/215 分類號(hào): G06F16/215;G06F16/2455
代理公司: 北京市萬(wàn)慧達(dá)律師事務(wù)所 11111 代理人: 黃玉東
地址: 210000 江*** 國(guó)省代碼: 江蘇;32
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 清洗 數(shù)據(jù)流 判定規(guī)則 刪除 數(shù)據(jù)安全性 第一數(shù)據(jù) 過濾處理 獲取數(shù)據(jù) 數(shù)據(jù)建立 數(shù)據(jù)清理 數(shù)據(jù)清洗 數(shù)據(jù)輸出 數(shù)據(jù)源 預(yù)設(shè) 字段 填充 檢測(cè) 申請(qǐng)
【權(quán)利要求書】:

1.一種數(shù)據(jù)清洗方法,所述方法包括:

從第一數(shù)據(jù)源中獲取數(shù)據(jù),利用獲取的數(shù)據(jù)建立一個(gè)獨(dú)立的數(shù)據(jù)流;

對(duì)所述數(shù)據(jù)流中的數(shù)據(jù)進(jìn)行過濾處理,得到待清洗數(shù)據(jù);

對(duì)所述待清洗數(shù)據(jù)中包含缺失值的字段進(jìn)行刪除或填充,得到初步清洗數(shù)據(jù);

檢測(cè)所述初步清洗數(shù)據(jù)是否符合預(yù)設(shè)的判定規(guī)則,刪除不符合判定規(guī)則的數(shù)據(jù),得到最終清洗數(shù)據(jù);

將所述最終清洗數(shù)據(jù)輸出到第二數(shù)據(jù)源。

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述待清洗數(shù)據(jù)中包含缺失值的字段進(jìn)行刪除或填充包括:

根據(jù)字段的缺失值條數(shù)占總條數(shù)的比例,計(jì)算得到字段的缺失率;

根據(jù)需要分析的指標(biāo),確定字段的屬性重要程度;

根據(jù)字段的缺失率和屬性重要程度,對(duì)所述包含缺失值的字段進(jìn)行刪除或填充。

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)字段的缺失率和屬性重要程度,對(duì)所述包含缺失值的字段進(jìn)行刪除或填充包括:

當(dāng)字段的缺失率低于預(yù)設(shè)的缺失率閾值且屬性重要程度低于預(yù)設(shè)的重要評(píng)級(jí)閾值時(shí),對(duì)字段進(jìn)行填充;

當(dāng)字段的缺失率不低于預(yù)設(shè)的缺失率閾值且屬性重要程度低于預(yù)設(shè)的重要評(píng)級(jí)閾值時(shí),刪除字段;

當(dāng)字段的缺失率不低于預(yù)設(shè)的缺失率閾值且屬性重要程度高于預(yù)設(shè)的重要評(píng)級(jí)閾值時(shí),對(duì)字段的缺失值進(jìn)行補(bǔ)全。

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

探查第一數(shù)據(jù)源中數(shù)據(jù)的描述數(shù)據(jù)屬性的元數(shù)據(jù),根據(jù)所述元數(shù)據(jù)分析得到數(shù)據(jù)存在的質(zhì)量問題,根據(jù)所述質(zhì)量問題設(shè)定過濾規(guī)則;

所述對(duì)所述數(shù)據(jù)流中的數(shù)據(jù)進(jìn)行過濾處理,得到待清洗數(shù)據(jù),包括:根據(jù)所述過濾規(guī)則對(duì)所述數(shù)據(jù)流中的數(shù)據(jù)進(jìn)行過濾處理,得到待清洗數(shù)據(jù)。

5.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述的方法,其特征在于,所述對(duì)所述數(shù)據(jù)流中的數(shù)據(jù)進(jìn)行過濾處理包括:

行級(jí)過濾,將數(shù)據(jù)中不需要的行剔除掉;

列級(jí)過濾,當(dāng)一行具有多個(gè)列的時(shí)候,只選取并保留所需列對(duì)應(yīng)的字段。

6.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述的方法,其特征在于,所述預(yù)設(shè)的判定規(guī)則包括合法性規(guī)則和邏輯規(guī)則,所述檢測(cè)所述初步清洗數(shù)據(jù)是否符合預(yù)設(shè)的判定規(guī)則包括:

如果所述初步清洗數(shù)據(jù)不符合所述合法性規(guī)則,將所述初步清洗數(shù)據(jù)設(shè)為符合所述合法性規(guī)則的最大值,或者刪除;

如果所述初步清洗數(shù)據(jù)不符合所述邏輯規(guī)則,將所述初步清洗數(shù)據(jù)刪除,并生成警告指令。

7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一數(shù)據(jù)源和第二數(shù)據(jù)源為同一分布式消息系統(tǒng)的不同數(shù)據(jù)類別,進(jìn)一步地,所述分布式消息系統(tǒng)為Kafka,所述第一數(shù)據(jù)源和第二數(shù)據(jù)源為Kafka的兩個(gè)不同的Topic;所述數(shù)據(jù)流采用基于Spark Streaming的數(shù)據(jù)流。

8.一種數(shù)據(jù)清洗裝置,其特征在于,所述裝置包括:

數(shù)據(jù)獲取模塊,用于從第一數(shù)據(jù)源中獲取數(shù)據(jù),利用獲取的數(shù)據(jù)建立一個(gè)獨(dú)立的數(shù)據(jù)流;

數(shù)據(jù)過濾模塊,用于對(duì)所述數(shù)據(jù)流中的數(shù)據(jù)進(jìn)行過濾處理,得到待清洗數(shù)據(jù);

初步清洗模塊,用于對(duì)所述待清洗數(shù)據(jù)中包含缺失值的字段進(jìn)行刪除或填充,得到初步清洗數(shù)據(jù);

最終清洗模塊,用于檢測(cè)所述初步清洗數(shù)據(jù)是否符合預(yù)設(shè)的判定規(guī)則,刪除不符合判定規(guī)則的數(shù)據(jù),得到最終清洗數(shù)據(jù);

數(shù)據(jù)輸出模塊,用于將所述最終清洗數(shù)據(jù)輸出到第二數(shù)據(jù)源。

9.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述方法的步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法的步驟。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇寧易購(gòu)集團(tuán)股份有限公司,未經(jīng)蘇寧易購(gòu)集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910308949.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 日韩av片无码一区二区不卡电影| 欧美3级在线| 国产一区二区在线免费| 国产精品综合久久| 久久久久久久亚洲国产精品87| 日本久久丰满的少妇三区| 国产精品一区二区av日韩在线| 亚洲精品国产主播一区| 欧美激情在线免费| 国内自拍偷拍一区| 亚洲精品乱码久久久久久写真| 国产.高清,露脸,对白| 国产乱色国产精品播放视频| 亚洲欧洲日韩在线| 久久精品视频中文字幕| 久久午夜精品福利一区二区 | 亚洲精品97久久久babes| 国产精品日韩一区二区三区| 国产1区2区3区| 国产精品久久91| 亚洲欧美一二三| 亚洲制服丝袜中文字幕| 一区二区三区欧美日韩| 久久网站精品| 国产精品对白刺激在线观看 | 手机看片国产一区| 国产69精品久久久久久| 国产日韩欧美亚洲| 97精品久久人人爽人人爽| 精品国产伦一区二区三区| 欧洲在线一区| 国产全肉乱妇杂乱视频在线观看| 亚洲欧美日本一区二区三区| 日韩av片无码一区二区不卡电影| 亚洲精品乱码久久久久久麻豆不卡| 久久精品国产99| 国产午夜精品免费一区二区三区视频| 国产精品久久久久久久久久久久久久久久久久 | 美国三级日本三级久久99| 91热国产| 99日韩精品视频| 国产欧美一区二区三区沐欲| 国产精品视频99| 国产精品一区二区人人爽| 国产精品一区二区不卡| 国产乱人伦精品一区二区三区| 国产精品久久久不卡| 国产色99| 亚洲欧美一二三| 国内精品久久久久影院日本| 国产精品一级片在线观看| 99国产精品| 欧美一区久久久| 国产大片黄在线观看私人影院| 97人人模人人爽人人喊小说| 欧美精品一卡二卡| 91久久国产露脸精品| 国产精品尤物麻豆一区二区三区| 搡少妇在线视频中文字幕| 26uuu亚洲电影在线观看| 精品国产鲁一鲁一区二区作者| 欧美高清视频一区二区三区| 国产三级国产精品国产专区50| 国产精品亚州| 狠狠躁日日躁狂躁夜夜躁| 四虎国产永久在线精品| 久久精品欧美一区二区 | 国产精品一区二区在线观看| 国产一区二区电影在线观看| 国产精品视频1区| 日本二区在线播放| 欧美三区二区一区| 综合国产一区| 黄色av中文字幕| 国产在线干| 午夜毛片在线| 国产主播啪啪| 中文天堂在线一区| 狠狠色噜狠狠狠狠| 91亚洲精品国偷拍自产| 欧美精品在线视频观看 | 97国产精品久久| 狠狠综合久久av一区二区老牛| 久久国产精品广西柳州门| 亚洲日韩欧美综合| 亚洲区日韩| 久久久一二区| 日韩一区二区福利视频| 日本一二三区电影| 国内久久精品视频| 日韩一区二区精品| 国产一级片自拍| 一区二区三区国产精品| 91理论片午午伦夜理片久久| 亚洲精品久久久久中文第一暮| 强行挺进女警紧窄湿润| 国产精品天堂| 国产视频一区二区视频| 精品国产乱码一区二区三区a | 国产在线卡一卡二| 97人人模人人爽人人喊小说| 亚洲精品人| 国产精品18久久久久久白浆动漫| 视频国产一区二区| 91性高湖久久久久久久久_久久99| 亚洲v欧美v另类v综合v日韩v| 国产精品视频一二区| 国产第一区在线观看| 国产在线视频二区| 色综合久久88| 91亚洲欧美强伦三区麻豆| 高清国产一区二区| 国产一区二区精华| 国产麻豆精品久久| 91久久国语露脸精品国产高跟| 欧美日韩国产三区| 四虎国产精品久久| 亚洲国产精品麻豆| 日日噜噜夜夜狠狠| 日日夜夜一区二区| 午夜免费av电影| 国产精品精品国内自产拍下载| 国产美女一区二区三区在线观看| 国产精品国产亚洲精品看不卡15| 日本一区二区在线电影| 亚洲精欧美一区二区精品| 国产精品久久久久久久综合| 精品国产区| 一区二区三区电影在线观看| 精品国产91久久久久久久| 中文字幕国内精品| 亚洲久色影视| 国产精品九九九九九九| 国产精品999久久久| 浪潮av网站| 久久久久国产亚洲| 午夜电影三级| 欧美日韩精品影院| 一色桃子av| 狠狠色丁香久久婷婷综合_中| 538国产精品| 91夜夜夜| 久久福利视频网| 大bbw大bbw超大bbw| 亚洲第一天堂久久| 狠狠躁夜夜av| 四虎国产精品久久| 国产97免费视频| 欧美精品一区二区三区在线四季| 欧美一区二区三区艳史| 97视频久久久| 国产精品理人伦一区二区三区| 欧美日韩一区二区高清| 九九国产精品视频| 精品中文久久| 亚洲欧美国产中文字幕| 97国产精品久久| 国产一区二区三区网站| 激情久久影院| 欧美激情精品一区| 三上悠亚亚洲精品一区二区| 日韩av不卡一区| 国产精品视频1区| 国产精品精品视频一区二区三区| 亚洲欧美自拍一区| 欧美日韩一区二区三区四区五区六区| 一区二区在线视频免费观看| 日韩午夜三级| 久久99国产精品久久99| 91一区二区在线观看| 国产91综合一区在线观看| 国产欧美亚洲精品第一区软件| 欧美日韩国产欧美| 久久免费视频99| 免费超级乱淫视频播放| 亚洲精品久久久久不卡激情文学| 一区二区三区欧美在线| 首页亚洲欧美制服丝腿| 免费超级乱淫视频播放| 影音先锋久久久| 十八无遮挡| 高清国产一区二区 | 69xx国产| 97久久久久亚洲| 91视频国产一区| 狠狠色狠狠色综合日日2019| 日韩欧美国产第一页| 国产精品久久久久久久久久久不卡| 亚洲精品乱码久久久久久按摩| 狠狠躁夜夜躁人人爽天天天天97| 日韩av在线中文| 国产午夜精品一区二区三区最新电影| 国产麻豆一区二区三区在线观看| 在线国产二区| 久久久久国产精品视频| 国产精品1区二区| 99久久国产综合精品女不卡| 午夜国内精品a一区二区桃色| 久久精品国产亚洲一区二区| 国产第一区二区| free性欧美hd另类丰满| 99久久国产综合| 国产精品国产三级国产专区52| 国产剧情在线观看一区二区| 满春阁精品av在线导航| 男女午夜影院| 久久不卡一区| 91国偷自产中文字幕婷婷| sb少妇高潮二区久久久久| 欧美一区二区三区不卡视频| 一区二区三区欧美视频| 偷拍自中文字av在线| 蜜臀久久99静品久久久久久| 久久精品国产亚| 国产麻豆一区二区三区精品| 国产偷久久一区精品69 | 国内久久久久久| 天天射欧美| 精品一区二区三区中文字幕| 欧美一区二区三区久久久| 91精品啪在线观看国产| 国产理论片午午午伦夜理片2021 | 国产毛片精品一区二区| 亚洲国产另类久久久精品性| 亚洲制服丝袜在线| 最新国产一区二区| 久久一区欧美| 久久精品综合视频| 欧美二区在线视频| 中文字幕欧美另类精品亚洲| 久久夜色精品国产亚洲| 91精品一区二区在线观看| 久久夜色精品国产亚洲| 欧美视频1区| 久久综合国产伦精品免费| 午夜爱爱电影| 狠狠躁天天躁又黄又爽| 久久二区视频| 中文在线一区二区三区| 午夜激情电影在线播放| 曰韩av在线| 国产69精品久久99的直播节目| 一区二区免费在线观看| 午夜影院啪啪| 免费精品一区二区三区视频日产| 久久精品亚洲一区二区三区画质|