[發(fā)明專利]一種基于HBase的分布式時(shí)序數(shù)據(jù)庫(kù)在審
| 申請(qǐng)?zhí)枺?/td> | 201711046071.5 | 申請(qǐng)日: | 2017-10-31 |
| 公開(kāi)(公告)號(hào): | CN110019085A | 公開(kāi)(公告)日: | 2019-07-16 |
| 發(fā)明(設(shè)計(jì))人: | 萬(wàn)英杰;鮑遠(yuǎn)松;董文生;黃明;孫冬雪;李亞貝;沈春鋒;滕逸龍 | 申請(qǐng)(專利權(quán))人: | 上海寶信軟件股份有限公司 |
| 主分類號(hào): | G06F16/182 | 分類號(hào): | G06F16/182;G06F16/22;G06F16/27;G06F16/25 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 郭國(guó)中 |
| 地址: | 201203 上海市浦*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 時(shí)序數(shù)據(jù)庫(kù) 智能化和信息化 分布式文件 實(shí)時(shí)數(shù)據(jù)庫(kù) 存儲(chǔ)結(jié)構(gòu) 時(shí)間跨度 支撐能力 擴(kuò)展性 傳統(tǒng)的 單元格 三元組 有效地 行鍵 檢索 數(shù)據(jù)庫(kù) 保存 | ||
本發(fā)明提供了一種基于HBase的分布式時(shí)序數(shù)據(jù)庫(kù),存儲(chǔ)結(jié)構(gòu)為三元組:TagID,Timestamp,TagVTQ;分布式時(shí)序數(shù)據(jù)庫(kù)中的分布式文件數(shù)據(jù)庫(kù)HBase的行鍵由TagID和BaseTime組成,BaseTime=Timestamp/TimeSpan,TimeSpan為分布式時(shí)序數(shù)據(jù)庫(kù)的行時(shí)間跨度,HBase的列族中每個(gè)HBase單元格保存至少一個(gè)TagVTQ。本發(fā)明可有效的解決傳統(tǒng)的實(shí)時(shí)數(shù)據(jù)庫(kù)在應(yīng)對(duì)工業(yè)大數(shù)據(jù)在可靠性、擴(kuò)展性、檢索和其上的計(jì)算支撐能力的不足,有效地提升企業(yè)的智能化和信息化水平。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)庫(kù)技術(shù)領(lǐng)域,具體地,涉及一種基于HBase的分布式時(shí)序數(shù)據(jù)庫(kù)。
背景技術(shù)
隨著工業(yè)大數(shù)據(jù)時(shí)代的來(lái)臨,工業(yè)設(shè)備的智能化程度不斷提升,工業(yè)企業(yè)跨區(qū)域、跨企業(yè)的數(shù)據(jù)互聯(lián),產(chǎn)區(qū)、企業(yè)之間的聯(lián)動(dòng),能極大的共享信息和資源、提升企業(yè)生產(chǎn)效率、節(jié)約企業(yè)成本。這一變革導(dǎo)致物聯(lián)網(wǎng)設(shè)備和傳感器數(shù)量急劇增長(zhǎng),隨之而來(lái)的也帶來(lái)了數(shù)據(jù)的快速爆發(fā)式增長(zhǎng),時(shí)序數(shù)據(jù)庫(kù)己逐漸替代傳統(tǒng)的實(shí)時(shí)數(shù)據(jù)庫(kù),成為工業(yè)大數(shù)據(jù)存儲(chǔ)的首選,成為支撐制造、交通、能源、智慧城市等領(lǐng)域的核心產(chǎn)品。新興的時(shí)序數(shù)據(jù)庫(kù)技術(shù)興起,出現(xiàn)了多個(gè)開(kāi)源或商業(yè)時(shí)序數(shù)據(jù)庫(kù)產(chǎn)品,如:OpenTSDB、InfluxDB、Graphite、Gorilla等。對(duì)比這些時(shí)序數(shù)據(jù)庫(kù)產(chǎn)品,發(fā)現(xiàn)這些產(chǎn)品有如下局限性:
1、為節(jié)省數(shù)據(jù)存儲(chǔ)空間,為metric,tag key,tag value都設(shè)計(jì)了映射表,數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)不是自描述的,數(shù)據(jù)寫入、讀取都需依賴映射表對(duì)數(shù)據(jù)進(jìn)行映射和解析,增加了查詢和寫入的復(fù)雜度,影響了數(shù)據(jù)的查詢和寫入性能,如OpenTSDB。
2、部分時(shí)序數(shù)據(jù)庫(kù)支持的數(shù)據(jù)類型不全面,僅支持簡(jiǎn)單數(shù)據(jù)類型,不支持String,Blob數(shù)據(jù)類型,如OpenTSDB。
3、部分時(shí)序數(shù)據(jù)庫(kù)做聚合查詢時(shí),是根據(jù)查詢條件把所有符合條件的數(shù)據(jù)都查到內(nèi)存再聚合,導(dǎo)致大時(shí)間范圍查詢,易出現(xiàn)內(nèi)存不足,性能下降的情況,如OpenTSDB。
4、部分時(shí)序數(shù)據(jù)庫(kù)為追求性能,內(nèi)核完全in-memory,設(shè)計(jì)為內(nèi)存時(shí)序數(shù)據(jù)庫(kù),只解決26H內(nèi)近期數(shù)據(jù)的讀寫,如Gorilla。
5、部分時(shí)序數(shù)據(jù)庫(kù)壓縮率不足,且可能導(dǎo)致數(shù)據(jù)精度下降,如OpenTSDB、InfluxDB。
6、部分時(shí)序數(shù)據(jù)庫(kù)不支持?jǐn)?shù)據(jù)時(shí)序抖動(dòng),如Graphite。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種基于HBase的分布式時(shí)序數(shù)據(jù)庫(kù)。
根據(jù)本發(fā)明提供的一種基于HBase的分布式時(shí)序數(shù)據(jù)庫(kù),所述分布式時(shí)序數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)為三元組:TagID,Timestamp,TagVTQ;
其中TagID代表存儲(chǔ)數(shù)據(jù)的點(diǎn)的ID,一個(gè)點(diǎn)保存一個(gè)物理設(shè)備/傳感器的一屬性項(xiàng),TimeStamp為所述物理設(shè)備/傳感器生成的記錄產(chǎn)生的時(shí)間,TagVTQ為所述物理設(shè)備/傳感器的三元組:Value,Type,Quality,其中Value為具體的值,Type為數(shù)據(jù)類型,Quality為數(shù)據(jù)質(zhì)量;
所述分布式時(shí)序數(shù)據(jù)庫(kù)中的分布式文件數(shù)據(jù)庫(kù)HBase的行鍵由TagID和BaseTime組成,BaseTime=Timestamp/TimeSpan,TimeSpan為分布式時(shí)序數(shù)據(jù)庫(kù)的行時(shí)間跨度,HBase的列族中每個(gè)單元格保存至少一個(gè)TagVTQ。
優(yōu)選的,所述基于HBase的分布式時(shí)序數(shù)據(jù)庫(kù)分為:
數(shù)據(jù)采集層:通過(guò)數(shù)據(jù)采集網(wǎng)關(guān)或直接訪問(wèn)SDK接口,提交數(shù)據(jù)存儲(chǔ)或查詢請(qǐng)求;
數(shù)據(jù)接入層:采用分布式消息系統(tǒng)Kafka接收所述數(shù)據(jù)采集層提交的數(shù)據(jù)并持久化;
數(shù)據(jù)處理層:包括分布式實(shí)時(shí)數(shù)據(jù)緩存服務(wù)、分布式歷史數(shù)據(jù)歸檔服務(wù)、發(fā)布/訂閱管理服務(wù)和數(shù)據(jù)聚合服務(wù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海寶信軟件股份有限公司,未經(jīng)上海寶信軟件股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711046071.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種時(shí)序數(shù)據(jù)的處理方法及裝置
- 用于服務(wù)器的數(shù)據(jù)遷移方法和裝置
- 一種工業(yè)時(shí)序數(shù)據(jù)的訪問(wèn)方法及系統(tǒng)
- 一種時(shí)序數(shù)據(jù)庫(kù)的分布式存儲(chǔ)擴(kuò)容方法及數(shù)據(jù)查詢方法
- 時(shí)序消息的同步方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 一種適配多種時(shí)序數(shù)據(jù)庫(kù)的微服務(wù)的方法和裝置
- 軌道交通TIAS系統(tǒng)的時(shí)序數(shù)據(jù)、數(shù)據(jù)存儲(chǔ)方法及裝置
- 基于云計(jì)算的時(shí)序日志管理系統(tǒng)及包含該系統(tǒng)的電子設(shè)備
- 物聯(lián)網(wǎng)場(chǎng)景下的數(shù)據(jù)處理方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)
- 基于消息隊(duì)列實(shí)現(xiàn)的高可用時(shí)序數(shù)據(jù)庫(kù)集群系統(tǒng)
- 一種電力數(shù)據(jù)倉(cāng)庫(kù)業(yè)務(wù)智能統(tǒng)計(jì)分析方法
- 全新高分子全自動(dòng)泡藥機(jī)
- 一種新型建筑節(jié)能智能化系統(tǒng)
- 智能信息化、多車協(xié)同作業(yè)城市垃圾收集轉(zhuǎn)運(yùn)系統(tǒng)及方法
- 一種空港物流信息網(wǎng)絡(luò)智能化系統(tǒng)的架構(gòu)構(gòu)建方法
- 一種基于物聯(lián)網(wǎng)技術(shù)的智能控制吊掛系統(tǒng)
- 一種基于物聯(lián)網(wǎng)技術(shù)的云端控制吊掛系統(tǒng)
- 一種基于實(shí)時(shí)檢測(cè)且生長(zhǎng)狀況預(yù)估技術(shù)的水稻栽培方法
- 一種基于實(shí)時(shí)檢測(cè)且生長(zhǎng)狀況預(yù)估技術(shù)的小麥種植方法
- 一種信息化、智能化二襯臺(tái)車
- 一種實(shí)現(xiàn)IEC61850信息間接接入實(shí)時(shí)數(shù)據(jù)庫(kù)的方法
- 基于工業(yè)實(shí)時(shí)數(shù)據(jù)庫(kù)的石油井場(chǎng)實(shí)時(shí)數(shù)據(jù)存儲(chǔ)管理方法
- 鍋爐控制中的基于OPC服務(wù)器的實(shí)時(shí)數(shù)據(jù)庫(kù)實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)更新的裝置及數(shù)據(jù)實(shí)時(shí)更新方法
- 面向電力系統(tǒng)的并行實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)及其數(shù)據(jù)管理方法
- 實(shí)時(shí)數(shù)據(jù)庫(kù)中根據(jù)點(diǎn)名找到數(shù)據(jù)庫(kù)并訪問(wèn)的系統(tǒng)與方法
- 一種異構(gòu)實(shí)時(shí)數(shù)據(jù)庫(kù)的統(tǒng)一應(yīng)用程序編程接口實(shí)現(xiàn)方法
- 智能電網(wǎng)調(diào)度控制系統(tǒng)實(shí)時(shí)數(shù)據(jù)庫(kù)監(jiān)視系統(tǒng)和方法
- 一種工業(yè)實(shí)時(shí)數(shù)據(jù)庫(kù)OPC UA數(shù)據(jù)接口實(shí)現(xiàn)方法
- 一種實(shí)時(shí)數(shù)據(jù)庫(kù)的關(guān)系化實(shí)現(xiàn)方法、裝置及系統(tǒng)
- 一種提高實(shí)時(shí)數(shù)據(jù)庫(kù)數(shù)據(jù)處理性能的裝置及處理方法





