[發(fā)明專利]數(shù)據(jù)統(tǒng)計(jì)方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201710467826.2 | 申請(qǐng)日: | 2017-06-19 |
| 公開(公告)號(hào): | CN109145027A | 公開(公告)日: | 2019-01-04 |
| 發(fā)明(設(shè)計(jì))人: | 范曉亮;余俊 | 申請(qǐng)(專利權(quán))人: | 中興通訊股份有限公司 |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/248 |
| 代理公司: | 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 胡海國(guó) |
| 地址: | 518057 廣東省深圳市南山*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)統(tǒng)計(jì) 預(yù)處理 原始數(shù)據(jù)流 統(tǒng)計(jì) 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 統(tǒng)計(jì)條件 類信息 元數(shù)據(jù) 預(yù)設(shè) 數(shù)據(jù)統(tǒng)計(jì)裝置 配置文件 統(tǒng)計(jì)結(jié)果 調(diào)用 解析 開發(fā) 維護(hù) | ||
本發(fā)明公開了一種數(shù)據(jù)統(tǒng)計(jì)方法,該方法包括:獲取待統(tǒng)計(jì)的原始數(shù)據(jù)流;根據(jù)所述原始數(shù)據(jù)流調(diào)用并解析預(yù)設(shè)的數(shù)據(jù)統(tǒng)計(jì)配置文件,得到預(yù)設(shè)類型的待生成統(tǒng)計(jì)報(bào)表的預(yù)處理類信息和統(tǒng)計(jì)條件信息;根據(jù)所述預(yù)處理類信息對(duì)所述原始數(shù)據(jù)流進(jìn)行預(yù)處理,得到對(duì)應(yīng)的統(tǒng)計(jì)元數(shù)據(jù);根據(jù)所述統(tǒng)計(jì)條件信息對(duì)所述統(tǒng)計(jì)元數(shù)據(jù)進(jìn)行統(tǒng)計(jì),根據(jù)統(tǒng)計(jì)結(jié)果生成對(duì)應(yīng)的統(tǒng)計(jì)報(bào)表。本發(fā)明還公開了一種數(shù)據(jù)統(tǒng)計(jì)裝置、設(shè)備和一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。本發(fā)明能夠提高基于Spark平臺(tái)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)的代碼靈活性,降低代碼的開發(fā)維護(hù)成本。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及數(shù)據(jù)統(tǒng)計(jì)方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
Spark是一種專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的通用計(jì)算引擎,近年來,隨著大數(shù)據(jù)平臺(tái)Spark系統(tǒng)的出現(xiàn)和逐步發(fā)展成熟,如何在Spark平臺(tái)上實(shí)現(xiàn)各種機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘并行化算法設(shè)計(jì)成為了目前國(guó)內(nèi)外關(guān)注的重點(diǎn)。
目前,在基于Spark平臺(tái)進(jìn)行數(shù)據(jù)分析的時(shí)候,每新增一類業(yè)務(wù)統(tǒng)計(jì),開發(fā)人員需要重新開發(fā)統(tǒng)計(jì)代碼,需要耗費(fèi)較多的時(shí)間成本和人力成本,而且,業(yè)務(wù)及其統(tǒng)計(jì)規(guī)則的變更會(huì)引起代碼的頻繁修改,導(dǎo)致較高的出錯(cuò)幾率和測(cè)試成本,隨著時(shí)間的變遷和業(yè)務(wù)的頻繁變化,代碼也會(huì)越來越臃腫,導(dǎo)致代碼難于維護(hù),因而,現(xiàn)有的基于Spark平臺(tái)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)的代碼靈活性還有待提高。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提出一種數(shù)據(jù)統(tǒng)計(jì)方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),旨在提高基于Spark平臺(tái)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)的代碼靈活性,降低代碼的開發(fā)維護(hù)成本。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種數(shù)據(jù)統(tǒng)計(jì)方法,所述數(shù)據(jù)統(tǒng)計(jì)方法包括如下步驟:
獲取待統(tǒng)計(jì)的原始數(shù)據(jù)流;
根據(jù)所述原始數(shù)據(jù)流調(diào)用并解析預(yù)設(shè)的數(shù)據(jù)統(tǒng)計(jì)配置文件,得到預(yù)設(shè)類型的待生成統(tǒng)計(jì)報(bào)表的預(yù)處理類信息和統(tǒng)計(jì)條件信息;
根據(jù)所述預(yù)處理類信息對(duì)所述原始數(shù)據(jù)流進(jìn)行預(yù)處理,得到對(duì)應(yīng)的統(tǒng)計(jì)元數(shù)據(jù);
根據(jù)所述統(tǒng)計(jì)條件信息對(duì)所述統(tǒng)計(jì)元數(shù)據(jù)進(jìn)行統(tǒng)計(jì),根據(jù)統(tǒng)計(jì)結(jié)果生成對(duì)應(yīng)的統(tǒng)計(jì)報(bào)表。
優(yōu)選地,所述獲取待統(tǒng)計(jì)的原始數(shù)據(jù)流的步驟之前,還包括:
設(shè)置待生成統(tǒng)計(jì)報(bào)表的類型,并為每種類型的待生成統(tǒng)計(jì)報(bào)表設(shè)置對(duì)應(yīng)的預(yù)處理類信息和統(tǒng)計(jì)條件信息;
將設(shè)置結(jié)果保存至數(shù)據(jù)統(tǒng)計(jì)配置文件中。
優(yōu)選地,所述獲取待統(tǒng)計(jì)的原始數(shù)據(jù)流的步驟包括:
向預(yù)設(shè)的業(yè)務(wù)消息系統(tǒng)發(fā)送消息數(shù)據(jù)請(qǐng)求;
接收所述業(yè)務(wù)消息系統(tǒng)基于所述消息數(shù)據(jù)請(qǐng)求返回的消息數(shù)據(jù)流,將所述消息數(shù)據(jù)流作為待統(tǒng)計(jì)的原始數(shù)據(jù)流。
優(yōu)選地,所述根據(jù)所述預(yù)處理類信息對(duì)所述原始數(shù)據(jù)流進(jìn)行預(yù)處理,得到對(duì)應(yīng)的統(tǒng)計(jì)元數(shù)據(jù)的步驟包括:
根據(jù)所述預(yù)處理類信息中的分隔符將所述原始數(shù)據(jù)流分割為若干個(gè)預(yù)處理類;
按照預(yù)設(shè)的格式轉(zhuǎn)換規(guī)則對(duì)每個(gè)預(yù)處理類下的原始數(shù)據(jù)流進(jìn)行格式轉(zhuǎn)換,得到對(duì)應(yīng)的統(tǒng)計(jì)元數(shù)據(jù)。
優(yōu)選地,所述根據(jù)所述統(tǒng)計(jì)條件信息對(duì)所述統(tǒng)計(jì)元數(shù)據(jù)進(jìn)行統(tǒng)計(jì),根據(jù)統(tǒng)計(jì)結(jié)果生成對(duì)應(yīng)的統(tǒng)計(jì)報(bào)表的步驟包括:
根據(jù)所述統(tǒng)計(jì)條件信息中的邏輯運(yùn)算表達(dá)式對(duì)所述統(tǒng)計(jì)元數(shù)據(jù)進(jìn)行邏輯運(yùn)算;
根據(jù)所述邏輯運(yùn)算結(jié)果生成對(duì)應(yīng)的統(tǒng)計(jì)報(bào)表。
優(yōu)選地,所述根據(jù)所述邏輯運(yùn)算結(jié)果生成對(duì)應(yīng)的統(tǒng)計(jì)報(bào)表的步驟之后,還包括:
將生成的所述統(tǒng)計(jì)報(bào)表存儲(chǔ)至Spark平臺(tái)的數(shù)據(jù)庫中。
優(yōu)選地,所述數(shù)據(jù)統(tǒng)計(jì)方法還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司,未經(jīng)中興通訊股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710467826.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 業(yè)務(wù)數(shù)據(jù)統(tǒng)計(jì)量驗(yàn)證方法及用戶設(shè)備
- 數(shù)據(jù)統(tǒng)計(jì)方法及裝置
- 數(shù)據(jù)處理方法、數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)及后臺(tái)管理系統(tǒng)
- 一種數(shù)據(jù)統(tǒng)計(jì)的方法及裝置
- 一種數(shù)據(jù)統(tǒng)計(jì)處理方法及裝置
- 一種基于表單組件實(shí)現(xiàn)數(shù)據(jù)統(tǒng)計(jì)的方法及系統(tǒng)
- 自動(dòng)化測(cè)試方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 基于定制報(bào)表的數(shù)據(jù)統(tǒng)計(jì)展示方法、裝置、設(shè)備及介質(zhì)
- 一種基于多維數(shù)據(jù)標(biāo)注的動(dòng)態(tài)數(shù)據(jù)統(tǒng)計(jì)方法及系統(tǒng)
- 數(shù)據(jù)統(tǒng)計(jì)方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 電鍍預(yù)處理溶液和電鍍預(yù)處理方法
- 鐵水預(yù)處理方法及其預(yù)處理裝置
- 預(yù)處理裝置及其預(yù)處理方法
- 預(yù)處理組件、使用該預(yù)處理組件進(jìn)行試樣的預(yù)處理的預(yù)處理裝置及包括該預(yù)處理裝置的分析系統(tǒng)
- 待測(cè)樣品預(yù)處理裝置、預(yù)處理筒及預(yù)處理方法
- 醋酸纖維卷曲預(yù)處理裝置、預(yù)處理液及預(yù)處理方法
- 預(yù)處理裝置
- 預(yù)處理濾芯
- 甘薯儲(chǔ)藏預(yù)處理設(shè)備及預(yù)處理方法
- 水樣預(yù)處理裝置、水樣預(yù)處理系統(tǒng)及水樣預(yù)處理方法
- 具有內(nèi)部通信網(wǎng)絡(luò)的集成電路
- 交織器設(shè)備及方法
- 安全的組合可互操作復(fù)用
- 多傳輸流接收機(jī)
- 一種異構(gòu)網(wǎng)絡(luò)及其數(shù)據(jù)流導(dǎo)引方法和交換機(jī)
- 一種SPI傳輸方法、裝置、控制器、加密芯片及通信設(shè)備
- 基于數(shù)據(jù)傳輸?shù)牟铄e(cuò)控制方法、裝置和系統(tǒng)
- 面向分布式機(jī)器學(xué)習(xí)的數(shù)據(jù)傳輸方法及系統(tǒng)
- 一種數(shù)據(jù)處理系統(tǒng)、方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)流圖處理方法、裝置、設(shè)備以及可讀存儲(chǔ)介質(zhì)
- 統(tǒng)計(jì)系統(tǒng)、統(tǒng)計(jì)裝置和統(tǒng)計(jì)方法
- 人數(shù)統(tǒng)計(jì)方法和人數(shù)統(tǒng)計(jì)系統(tǒng)
- 統(tǒng)計(jì)物體數(shù)量的統(tǒng)計(jì)系統(tǒng)
- 網(wǎng)絡(luò)處理器的統(tǒng)計(jì)計(jì)數(shù)方法
- 統(tǒng)計(jì)信息上報(bào)方法及裝置
- 稿件統(tǒng)計(jì)方法和稿件統(tǒng)計(jì)系統(tǒng)
- 數(shù)據(jù)統(tǒng)計(jì)方法及裝置
- 獲取數(shù)據(jù)的統(tǒng)計(jì)狀態(tài)的方法及裝置
- 信息統(tǒng)計(jì)方法和信息統(tǒng)計(jì)裝置
- 電量統(tǒng)計(jì)系統(tǒng)及電量統(tǒng)計(jì)方法





