[發(fā)明專利]實時數(shù)據(jù)統(tǒng)計裝置和方法以及計算機可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810434471.1 | 申請日: | 2018-05-09 |
| 公開(公告)號: | CN110471943A | 公開(公告)日: | 2019-11-19 |
| 發(fā)明(設計)人: | 支海邦;李猛;喻海林;周龍亭 | 申請(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 11038 中國國際貿(mào)易促進委員會專利商標事務所 | 代理人: | 李昊;許蓓<國際申請>=<國際公布>=< |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 統(tǒng)計數(shù)據(jù) 二級緩存單元 實時數(shù)據(jù) 統(tǒng)計模塊 統(tǒng)計裝置 一級緩存 原始數(shù)據(jù) 統(tǒng)計項 配置 寫入 計算機可讀存儲介質(zhì) 讀取 實時數(shù)據(jù)處理 持久化存儲 多點分布 多級處理 時間粒度 統(tǒng)計結(jié)果 統(tǒng)計 預設 字段 | ||
本發(fā)明公開了一種實時數(shù)據(jù)統(tǒng)計裝置和方法以及計算機可讀存儲介質(zhì),涉及實時數(shù)據(jù)處理領(lǐng)域。實時數(shù)據(jù)統(tǒng)計裝置包括:一級統(tǒng)計模塊,被配置為采用預設的時間粒度對獲取的原始數(shù)據(jù)進行統(tǒng)計,生成包括原始數(shù)據(jù)中的統(tǒng)計項和統(tǒng)計結(jié)果字段的中間統(tǒng)計數(shù)據(jù),將中間統(tǒng)計數(shù)據(jù)寫入一級緩存單元中;二級統(tǒng)計模塊,被配置為讀取多個一級緩存單元中的中間統(tǒng)計數(shù)據(jù),將統(tǒng)計項的值相同的中間統(tǒng)計數(shù)據(jù)寫入同一個二級緩存單元中;三級統(tǒng)計模塊,被配置為對每個二級緩存單元中的數(shù)據(jù)進行統(tǒng)計,生成最終統(tǒng)計數(shù)據(jù),并將每個二級緩存單元生成的最終統(tǒng)計數(shù)據(jù)進行持久化存儲。本發(fā)明通過對數(shù)據(jù)進行多級處理,實現(xiàn)了數(shù)據(jù)的均勻多點分布,提高了實時數(shù)據(jù)統(tǒng)計的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及實時數(shù)據(jù)處理領(lǐng)域,特別涉及一種實時數(shù)據(jù)統(tǒng)計裝置和方法以及計算機可讀存儲介質(zhì)。
背景技術(shù)
針對海量數(shù)據(jù)的實時統(tǒng)計,傳統(tǒng)的實時數(shù)據(jù)統(tǒng)計方法大多基于批處理模式,實時數(shù)據(jù)流需要預先存儲在數(shù)據(jù)庫管理系統(tǒng)中才可進行后續(xù)的統(tǒng)計計算。相關(guān)技術(shù)主要使用關(guān)系型數(shù)據(jù)庫,比如Oracle、MySQL等存儲原始數(shù)據(jù)流,并根據(jù)數(shù)據(jù)統(tǒng)計邏輯編寫相應的SQL(Structured Query Language,結(jié)構(gòu)化查詢語言)語句和統(tǒng)計腳本,并將統(tǒng)計腳本得到的最終統(tǒng)計結(jié)果保存到數(shù)據(jù)庫。然而,相關(guān)技術(shù)在海量實時數(shù)據(jù)環(huán)境下,統(tǒng)計邏輯計算比較復雜,導致數(shù)據(jù)庫計算和讀寫性能下降。
發(fā)明內(nèi)容
本發(fā)明實施例所要解決的一個技術(shù)問題是:如何提高實時數(shù)據(jù)統(tǒng)計的效率。
根據(jù)本發(fā)明一些實施例的第一個方面,提供一種實時數(shù)據(jù)統(tǒng)計裝置,包括:一級統(tǒng)計模塊,被配置為采用預設的時間粒度對獲取的原始數(shù)據(jù)進行統(tǒng)計,生成包括原始數(shù)據(jù)中的統(tǒng)計項和統(tǒng)計結(jié)果字段的中間統(tǒng)計數(shù)據(jù),將中間統(tǒng)計數(shù)據(jù)寫入一級緩存單元中;二級統(tǒng)計模塊,被配置為讀取多個一級緩存單元中的中間統(tǒng)計數(shù)據(jù),將統(tǒng)計項的值相同的中間統(tǒng)計數(shù)據(jù)寫入同一個二級緩存單元中;三級統(tǒng)計模塊,被配置為對每個二級緩存單元中的數(shù)據(jù)進行統(tǒng)計,生成最終統(tǒng)計數(shù)據(jù),并將每個二級緩存單元生成的最終統(tǒng)計數(shù)據(jù)進行持久化存儲。
在一些實施例中,一級統(tǒng)計模塊、二級統(tǒng)計模塊、三級統(tǒng)計模塊并行執(zhí)行。
在一些實施例中,一級統(tǒng)計模塊包括多個一級統(tǒng)計進程,每個一級統(tǒng)計進程被配置為從與一級統(tǒng)計進程預先關(guān)聯(lián)的數(shù)據(jù)源中獲取原始數(shù)據(jù);或者,二級統(tǒng)計模塊包括多個二級統(tǒng)計進程,每個二級統(tǒng)計進程被配置為從二級統(tǒng)計進程預先關(guān)聯(lián)的一級緩存單元中讀取中間統(tǒng)計數(shù)據(jù);或者,三級統(tǒng)計模塊包括多個三級統(tǒng)計進程,每個三級統(tǒng)計進程分別被配置為統(tǒng)計三級統(tǒng)計進程預先關(guān)聯(lián)的每個二級緩存單元中的數(shù)據(jù),三級統(tǒng)計進程的數(shù)量等于二級緩存單元的數(shù)量。
在一些實施例中,實時數(shù)據(jù)統(tǒng)計裝置還包括:位于一級統(tǒng)計模塊、二級統(tǒng)計模塊、三級統(tǒng)計模塊中的一個或多個中的主進程單元,被配置為讀取配置中心的配置信息,并根據(jù)配置信息創(chuàng)建、監(jiān)控、重建、或銷毀一級統(tǒng)計模塊的一級統(tǒng)計進程、二級統(tǒng)計模塊的二級統(tǒng)計進程、三級統(tǒng)計模塊的三級統(tǒng)計進程中的一個或多個。
在一些實施例中,一級緩存單元為隊列類型;或者,二級緩存單元為有序集合類型;二級統(tǒng)計模塊進一步被配置為向中間統(tǒng)計數(shù)據(jù)添加通用唯一識別碼字段和值。
在一些實施例中,一級統(tǒng)計模塊進一步被配置為采用隨機輪詢的方式將每條中間統(tǒng)計數(shù)據(jù)寫入多個一級緩存單元中的一個。
在一些實施例中,二級統(tǒng)計模塊進一步被配置為計算每條中間統(tǒng)計數(shù)據(jù)的統(tǒng)計項的值的哈希值,將計算出的哈希值相同的中間統(tǒng)計數(shù)據(jù)寫入同一個二級緩存單元中。
在一些實施例中,實時數(shù)據(jù)統(tǒng)計裝置還包括一級緩存單元、二級緩存單元、配置中心中的一種或多種;其中,配置中心被配置為存儲一級統(tǒng)計模塊、二級統(tǒng)計模塊、三級統(tǒng)計模塊的配置信息。
在一些實施例中,一級緩存單元和二級緩存單元為內(nèi)存數(shù)據(jù)庫Redis的節(jié)點。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810434471.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種處理產(chǎn)品統(tǒng)計數(shù)據(jù)的方法及裝置
- 一種統(tǒng)計數(shù)據(jù)的處理方法、相關(guān)裝置及系統(tǒng)
- 一種統(tǒng)計數(shù)據(jù)的存儲和查詢方法
- 針對查詢優(yōu)化的范圍分區(qū)統(tǒng)計數(shù)據(jù)的增量式維護
- 一種廣播平臺中統(tǒng)計數(shù)據(jù)的顯示方法及裝置
- 一種處理統(tǒng)計數(shù)據(jù)的方法
- 數(shù)據(jù)統(tǒng)計方法、裝置及電子設備
- 一種數(shù)據(jù)處理方法、裝置和存儲介質(zhì)
- 一種統(tǒng)計數(shù)據(jù)采集方法、裝置及設備
- 一種統(tǒng)計數(shù)據(jù)的獲取方法、裝置、電子設備及存儲介質(zhì)
- 一種信息緩存系統(tǒng)及方法
- 短消息中心系統(tǒng)及其消息存儲及轉(zhuǎn)移方法
- 一種短信的調(diào)度方法和系統(tǒng)
- 一種基于變頻雕刻的圖像信號處理器
- 一種網(wǎng)絡視頻處理芯片
- 一種參考數(shù)據(jù)訪問管理方法及裝置
- 面向多應用的數(shù)據(jù)存儲系統(tǒng)和數(shù)據(jù)存儲、調(diào)用方法
- 面向多應用的數(shù)據(jù)存儲系統(tǒng)
- 面向多應用的數(shù)據(jù)存儲系統(tǒng)和數(shù)據(jù)調(diào)用方法
- 實時數(shù)據(jù)統(tǒng)計裝置和方法以及計算機可讀存儲介質(zhì)
- 面向瘦客戶端的實時數(shù)據(jù)主動發(fā)布系統(tǒng)及方法
- 基于工業(yè)實時數(shù)據(jù)庫的石油井場實時數(shù)據(jù)存儲管理方法
- 發(fā)送用于構(gòu)成內(nèi)容的數(shù)據(jù)的發(fā)射機、接收和處理該數(shù)據(jù)的接收機及其方法
- 一種實時數(shù)據(jù)的可靠接收方法及裝置
- 實時數(shù)據(jù)交換的方法和系統(tǒng)
- 中央空調(diào)的海量實時數(shù)據(jù)服務平臺
- 一種傳感設備實時數(shù)據(jù)的管理方法
- 用于制造過程數(shù)據(jù)收集和分析的方法、系統(tǒng)及存儲介質(zhì)
- 機器人及時間對齊方法、裝置、電子設備、存儲介質(zhì)
- 實時數(shù)據(jù)處理方法和裝置
- 一種用戶網(wǎng)絡業(yè)務流量統(tǒng)計方法及系統(tǒng)、家庭網(wǎng)關(guān)
- 一種實現(xiàn)報文統(tǒng)計的裝置及方法
- 一種ONU單元的性能統(tǒng)計系統(tǒng)及方法
- 一種后向流量管控系統(tǒng)
- 一種審計數(shù)據(jù)對比分析管理系統(tǒng)
- 數(shù)據(jù)統(tǒng)計系統(tǒng)
- 位置編碼表單數(shù)據(jù)統(tǒng)計系統(tǒng)
- 一種基于大數(shù)據(jù)的財務交易評估系統(tǒng)
- 一種道路施工過程中材料信息的采集方法
- 一種藥品質(zhì)量監(jiān)管平臺的查詢統(tǒng)計系統(tǒng)





