[發(fā)明專利]一種原始數(shù)據(jù)處理方法在審
| 申請?zhí)枺?/td> | 201611110520.3 | 申請日: | 2016-12-02 | 
| 公開(公告)號: | CN108153793A | 公開(公告)日: | 2018-06-12 | 
| 發(fā)明(設(shè)計(jì))人: | 安西民;林殷;徐鳳桐 | 申請(專利權(quán))人: | 航天星圖科技(北京)有限公司 | 
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F21/62 | 
| 代理公司: | 北京安博達(dá)知識產(chǎn)權(quán)代理有限公司 11271 | 代理人: | 徐國文 | 
| 地址: | 101399 北京市順義區(qū)國*** | 國省代碼: | 北京;11 | 
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 原始數(shù)據(jù)處理 數(shù)據(jù)記錄 數(shù)據(jù)收集單元 集群存儲器 客戶端用戶 數(shù)據(jù)管理器 原始數(shù)據(jù)源 準(zhǔn)確度 刪除處理 選擇數(shù)據(jù) 用戶體驗(yàn) 原始數(shù)據(jù) 重復(fù)處理 客戶端 相似度 置信度 重復(fù) 工作量 自動化 記錄 矛盾 | ||
1.一種原始數(shù)據(jù)處理方法,其特征在于,該方法包括如下步驟:
步驟1:原始數(shù)據(jù)處理平臺對數(shù)據(jù)集合中的所有數(shù)據(jù)進(jìn)行格式內(nèi)容的標(biāo)準(zhǔn)化處理;
步驟2:原始數(shù)據(jù)處理平臺去除數(shù)據(jù)記錄中存在的明顯不合理字段值和一條數(shù)據(jù)記錄中存在明顯矛盾的字段值;
步驟3:原始數(shù)據(jù)處理平臺對數(shù)據(jù)集合進(jìn)行缺失補(bǔ)全;
步驟4:原始數(shù)據(jù)處理平臺找出相似重復(fù)的數(shù)據(jù)以便去重。
2.根據(jù)權(quán)利要求1所述的原始數(shù)據(jù)處理方法,其特征在于,原始數(shù)據(jù)處理平臺計(jì)算兩條數(shù)據(jù)記錄之間的相似度,如果相似度小于第一相似度閾值,則認(rèn)為該兩條數(shù)據(jù)記錄是重復(fù)數(shù)據(jù);。
3.根據(jù)權(quán)利要求2所述的原始數(shù)據(jù)處理方法,其特征在于,根據(jù)該兩條數(shù)據(jù)記錄的置信度選擇一條數(shù)據(jù)記錄進(jìn)行刪除。
4.根據(jù)權(quán)利要求1‐3任意一項(xiàng)所述的原始數(shù)據(jù)處理方法,其特征在于,原始數(shù)據(jù)處理平臺還包括登錄模塊,客戶端用戶可以通過該登陸模塊對該原始數(shù)據(jù)處理平臺進(jìn)行遠(yuǎn)程登錄。
5.根據(jù)權(quán)利要求4所述的原始數(shù)據(jù)處理方法,其特征在于,登錄模塊包括一圖形用戶界面,用戶通過該圖形用戶界面進(jìn)行登錄。
6.根據(jù)權(quán)利要求5所述的原始數(shù)據(jù)處理方法,其特征在于,客戶端通過用戶帳號和密碼進(jìn)行登錄。
7.根據(jù)權(quán)利要求5所述的原始數(shù)據(jù)處理方法,其特征在于,登錄模塊中關(guān)聯(lián)保存所有用戶帳號及其對應(yīng)的密碼和權(quán)限。
8.根據(jù)權(quán)利要求5所述的原始數(shù)據(jù)處理方法,其特征在于,不同的用戶可以通過不同的客戶端登錄,登陸后的用戶可以訪問權(quán)限范圍內(nèi)的數(shù)據(jù)。
9.根據(jù)權(quán)利要求5所述的原始數(shù)據(jù)處理方法,其特征在于,不同的用戶具有不同的權(quán)限。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于航天星圖科技(北京)有限公司,未經(jīng)航天星圖科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611110520.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
 
- 專利分類
 
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 醫(yī)用圖像數(shù)據(jù)處理裝置和醫(yī)用圖像數(shù)據(jù)處理方法
 - 一種大批量數(shù)據(jù)處理系統(tǒng)及方法
 - 大批量數(shù)據(jù)處理系統(tǒng)
 - 原始數(shù)據(jù)處理裝置、原始數(shù)據(jù)處理方法和成像設(shè)備
 - 耗時(shí)計(jì)算方法和裝置
 - 一種高爐冶煉水平分析系統(tǒng)
 - 一種原始數(shù)據(jù)處理方法
 - 一種用于提升數(shù)據(jù)安全性的數(shù)據(jù)處理方法
 - 一種基于數(shù)據(jù)分層思想的數(shù)據(jù)一致性管理系統(tǒng)
 - 一種化妝品檢驗(yàn)數(shù)據(jù)自動化處理及報(bào)告生成系統(tǒng)
 
- 數(shù)據(jù)記錄介質(zhì),數(shù)據(jù)記錄方法,和數(shù)據(jù)記錄設(shè)備
 - 數(shù)據(jù)記錄介質(zhì)、數(shù)據(jù)記錄方法和數(shù)據(jù)記錄裝置
 - 數(shù)據(jù)記錄介質(zhì)、數(shù)據(jù)記錄方法和數(shù)據(jù)記錄設(shè)備
 - 記錄數(shù)據(jù)記錄裝置和記錄數(shù)據(jù)記錄方法
 - 數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄方法及數(shù)據(jù)記錄程序
 - 數(shù)據(jù)記錄設(shè)備、數(shù)據(jù)記錄方法以及數(shù)據(jù)記錄程序
 - 數(shù)據(jù)記錄設(shè)備、數(shù)據(jù)記錄方法、以及數(shù)據(jù)記錄程序
 - 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置和數(shù)據(jù)記錄介質(zhì)
 - 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置和數(shù)據(jù)記錄介質(zhì)
 - 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄設(shè)備以及數(shù)據(jù)記錄介質(zhì)
 
- 磁共振成像裝置
 - 主備服務(wù)器上數(shù)據(jù)庫數(shù)據(jù)同步方法
 - 電子設(shè)備和數(shù)據(jù)獲取方法
 - 數(shù)據(jù)收集裝置、以及該數(shù)據(jù)收集裝置的控制方法
 - 一種嬰兒尿濕檢測監(jiān)護(hù)系統(tǒng)
 - 一種全天候工作型智能光纜交接箱
 - 一種基于互聯(lián)網(wǎng)的工業(yè)數(shù)據(jù)收集系統(tǒng)及其收集方法
 - 數(shù)據(jù)收集裝置、車載設(shè)備、數(shù)據(jù)收集系統(tǒng)和數(shù)據(jù)收集方法
 - 一種基于大數(shù)據(jù)的信息收集分析系統(tǒng)
 - 一種基于軌交云控的非時(shí)空數(shù)據(jù)變換歸集處理系統(tǒng)及方法
 
- 在故障切換之后對高速緩存數(shù)據(jù)的保存
 - 集群讀寫裝置及系統(tǒng)
 - 一種消息處理方法及服務(wù)器
 - 用于計(jì)算系統(tǒng)的統(tǒng)一系統(tǒng)寬尋址
 - 一種塊設(shè)備鏡像備份裝置
 - 實(shí)時(shí)寄存器值的集群間通信
 - 用于集群數(shù)據(jù)系統(tǒng)的基于列的數(shù)據(jù)布局技術(shù)
 - 一種歷史數(shù)據(jù)的管理方法及相關(guān)設(shè)備
 - 使用樹形直接存儲器存取(DMA)總線的神經(jīng)網(wǎng)絡(luò)權(quán)重分布
 - 集群存儲系統(tǒng)和元數(shù)據(jù)恢復(fù)方法
 





