日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 201711239139.1 申請(qǐng)日: 2017-12-01
公開(公告)號(hào): CN110019159A 公開(公告)日: 2019-07-16
發(fā)明(設(shè)計(jì))人: 祁建明;周峻松;徐繼峰;陳墩金 申請(qǐng)(專利權(quán))人: 廣州明領(lǐng)基因科技有限公司
主分類號(hào): G06F16/215 分類號(hào): G06F16/215;G06F16/25
代理公司: 暫無信息 代理人: 暫無信息
地址: 510610 廣東省廣州市天河區(qū)*** 國(guó)省代碼: 廣東;44
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 完整數(shù)據(jù) 大數(shù)據(jù) 數(shù)據(jù)源 清洗 預(yù)處理 結(jié)果數(shù)據(jù) 數(shù)據(jù)清理 新數(shù)據(jù)源 有效地 導(dǎo)出 推斷 修正 檢測(cè)
【說明書】:

發(fā)明公開了一種針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法,所述方法包括:S1,通過JDBC接口調(diào)入待清理的數(shù)據(jù);S2,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;S3,對(duì)數(shù)據(jù)進(jìn)行不完整數(shù)據(jù)的檢測(cè)、判別以及修正;S4,通過JDBC接口導(dǎo)出結(jié)果數(shù)據(jù)至新數(shù)據(jù)源。本發(fā)明方案利用數(shù)據(jù)源之間的屬性值并不是相互獨(dú)立的特性,通過識(shí)別屬性值之間的關(guān)系可以推斷出丟失的屬性值,有效地達(dá)到了數(shù)據(jù)清理的目的,提高了數(shù)據(jù)源的數(shù)據(jù)質(zhì)量。

技術(shù)領(lǐng)域

本發(fā)明屬于大數(shù)據(jù)清洗技術(shù)領(lǐng)域,涉及一種針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法。

背景技術(shù)

隨著信息化的進(jìn)展,企業(yè)內(nèi)部積累了大量的電子數(shù)據(jù),這些數(shù)據(jù)對(duì)企業(yè)非常重要。但由于各種原因,導(dǎo)致企業(yè)現(xiàn)有系統(tǒng)數(shù)據(jù)庫(kù)中存在重復(fù)的記錄、錯(cuò)誤的數(shù)據(jù)、不完整的數(shù)據(jù)等臟數(shù)據(jù)。這些臟數(shù)據(jù)會(huì)扭曲從數(shù)據(jù)中獲得的信息,影響信息系統(tǒng)的運(yùn)行效果,也為企業(yè)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)、建立決策支持系統(tǒng)、應(yīng)用商務(wù)智能化帶來隱患。

為提高信息系統(tǒng)的數(shù)據(jù)質(zhì)量,數(shù)據(jù)清理變得很重要。其中,數(shù)據(jù)不完整(Incompleteness)是產(chǎn)生數(shù)據(jù)質(zhì)量問題的一個(gè)重要因素。

簡(jiǎn)單地說,數(shù)據(jù)不完整是指數(shù)據(jù)源中屬性值的丟失問題。不完整數(shù)據(jù)的存在會(huì)引起決策錯(cuò)誤,特別是數(shù)值數(shù)據(jù)中出現(xiàn)不完整數(shù)據(jù),所以必須解決數(shù)據(jù)源中的數(shù)據(jù)不完整問題。

發(fā)明內(nèi)容

本發(fā)明目的在于提供一種針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法,為了克服數(shù)據(jù)源中的不完整數(shù)據(jù)會(huì)加大數(shù)據(jù)源清理的難度,降低數(shù)據(jù)質(zhì)量,影響數(shù)據(jù)挖掘效果的問題,利用數(shù)據(jù)源之間的屬性值并不是相互獨(dú)立的特性,通過識(shí)別屬性值之間的關(guān)系可以推斷出丟失的屬性值,有效地達(dá)到了數(shù)據(jù)清理的目的,提高了數(shù)據(jù)源的數(shù)據(jù)質(zhì)量。

為解決上述技術(shù)問題,本發(fā)明采用如下的技術(shù)方案:一種針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法,所述方法包括:S1,通過JDBC接口調(diào)入待清理的數(shù)據(jù);S2,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;S3,對(duì)數(shù)據(jù)進(jìn)行不完整數(shù)據(jù)的檢測(cè)、判別以及修正;S4,通過JDBC接口導(dǎo)出結(jié)果數(shù)據(jù)至新數(shù)據(jù)源。

進(jìn)一步地,所述步驟S1中,JDBC為Java DataBase Connectivity的縮寫,即Java數(shù)據(jù)庫(kù)連接,該接口把數(shù)據(jù)源中需要清理的數(shù)據(jù)調(diào)入到系統(tǒng)中,執(zhí)行數(shù)據(jù)清理。

進(jìn)一步地,所述步驟S2中,數(shù)據(jù)預(yù)處理是指標(biāo)準(zhǔn)化數(shù)據(jù)記錄格式,根據(jù)預(yù)定義的規(guī)則,把數(shù)據(jù)記錄中的相應(yīng)字段轉(zhuǎn)換成同一格式。

進(jìn)一步地,所述步驟S3中,利用算法庫(kù)、規(guī)則庫(kù)及數(shù)據(jù)清理日志完成對(duì)不完整數(shù)據(jù)的相關(guān)處理。

進(jìn)一步地,所述步驟S4中,JDBC將處理所得的正確數(shù)據(jù)導(dǎo)出至新數(shù)據(jù)庫(kù)。

本發(fā)明與現(xiàn)有技術(shù)相比具有以下的有益效果:

本發(fā)明方案針對(duì)數(shù)據(jù)源中的不完整數(shù)據(jù)會(huì)加大數(shù)據(jù)源清理的難度,降低數(shù)據(jù)質(zhì)量,影響數(shù)據(jù)挖掘效果的問題,利用數(shù)據(jù)源之間的屬性值并不是相互獨(dú)立的特性,通過識(shí)別屬性值之間的關(guān)系可以推斷出丟失的屬性值,達(dá)到數(shù)據(jù)清理的目的,提高數(shù)據(jù)源的數(shù)據(jù)質(zhì)量。

附圖說明

圖1是針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法的流程框圖。

圖2是針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法中不完整數(shù)據(jù)操作原理流程圖。

具體實(shí)施方式

下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明進(jìn)行更加詳細(xì)與完整的說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。

參照?qǐng)D1,本發(fā)明的一種針對(duì)不完整數(shù)據(jù)的大數(shù)據(jù)清洗方法,所述方法包括:

S1,把數(shù)據(jù)源中需要清理的數(shù)據(jù)通過JDBC(Java DataBase Connectivity,Java數(shù)據(jù)庫(kù)連接)接口調(diào)入到系統(tǒng)中來,執(zhí)行數(shù)據(jù)清理;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州明領(lǐng)基因科技有限公司,未經(jīng)廣州明領(lǐng)基因科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201711239139.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 99日韩精品视频| 福利视频亚洲一区| 妖精视频一区二区三区| 农村妇女毛片精品久久| 国产精品久久久久四虎| 99久久国产综合精品女不卡| 国产一区二区三区黄| 国产经典一区二区| 午夜看片网| 国产精品日韩一区二区| 中文字幕日韩一区二区| 国产精品综合在线观看| 真实的国产乱xxxx在线91| 日韩一级在线视频| 国产日韩欧美亚洲| 亚洲精品久久久中文| 国产视频精品久久| 日本高清h色视频在线观看| 国产aⅴ一区二区| 亚洲高清毛片一区二区| 午夜毛片在线看| 欧美激情在线免费| 伊人久久婷婷色综合98网| 久久天天躁狠狠躁亚洲综合公司 | 一区二区在线国产| 黄毛片免费| 夜夜躁日日躁狠狠躁| 国产精品一区二区日韩新区| 久久精品国产色蜜蜜麻豆| 精品日韩久久久| 国产精品久久久视频| 美女直播一区二区三区| 国内精品在线免费| 国产麻豆精品久久| 免费a一毛片| 秋霞av电影网| 久久精品中文字幕一区| 91精品夜夜| 亚洲四区在线| 久久久国产精品一区| 国产有码aaaae毛片视频| 亚洲综合日韩精品欧美综合区| 91精品美女| 大bbw大bbw超大bbw| 玖玖玖国产精品| 色婷婷精品久久二区二区6| 老太脱裤子让老头玩xxxxx| 午夜情所理论片| 97国产精品久久| 国产精品一区二区在线观看| 欧美在线一级va免费观看| 国产欧美综合一区| 精品国产一区二区三区高潮视| 国产天堂第一区| 国产大学生呻吟对白精彩在线| 欧洲在线一区| 欧美xxxxxhd| 91精品啪在线观看国产线免费| 99精品视频一区二区| 亚洲日韩aⅴ在线视频| 91福利视频免费观看| 四虎影视亚洲精品国产原创优播| 精品久久久影院| 福利电影一区二区三区| 久久久精品欧美一区二区免费| 亚洲欧美国产精品一区二区| 午夜码电影| 国产一区网址| 精品国产鲁一鲁一区二区三区| 亚洲国产欧美一区| 国产欧美日韩二区| 国产精品视频一区二区在线观看| 国产一区二区二| 精品国产一区二区三区四区vr| 国产一区二区免费在线| 亚洲视频h| 国产一区二区三区午夜| 日韩亚洲精品在线观看| 日本三级韩国三级国产三级| 精品一区二区三区视频?| 日韩av电影手机在线观看| 国产精品久久久久久久新郎|