[發(fā)明專利]時序數(shù)據(jù)的存儲方法、分析方法及裝置有效
| 申請?zhí)枺?/td> | 201910270612.5 | 申請日: | 2019-04-04 |
| 公開(公告)號: | CN110109923B | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計)人: | 劉睿;黃踐焜 | 申請(專利權(quán))人: | 北京市天元網(wǎng)絡(luò)技術(shù)股份有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/242;G06F16/2458;G06F16/28 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王慶龍;苗曉靜 |
| 地址: | 100193 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 時序 數(shù)據(jù) 存儲 方法 分析 裝置 | ||
1.一種時序數(shù)據(jù)的存儲方法,其特征在于,包括:
根據(jù)時序數(shù)據(jù)的采樣時間間隔,獲取所述時序數(shù)據(jù)的時間精度;
根據(jù)時序數(shù)據(jù)的時間戳以及時間精度,將時間戳相同、時間精度相同的多個時序數(shù)據(jù)聚合為文件切片;
以時間精度和時間戳為HBase行鍵,將所述文件切片存儲至HBase數(shù)據(jù)庫;
所述以時間精度和時間戳為HBase行鍵,將所述文件切片存儲至HBase數(shù)據(jù)庫的步驟,具體為:
獲取所述文件切片的大小;
若所述文件切片的大小大于預(yù)設(shè)字節(jié)長度,則對所述文件切片作進一步切分,生成多個子切片;
以時間精度、時間戳和子切片的切片號為行鍵,將所述多個子切片存儲至HBase數(shù)據(jù)庫中;
若所述文件切片的大小小于等于預(yù)設(shè)字節(jié)長度,則將所述文件切片對應(yīng)的切片號設(shè)置為零,以時間精度、時間戳和所述文件切片的切片號作為行鍵,將所述文件切片存儲至HBase數(shù)據(jù)庫中。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述文件切片作進一步切分,生成多個子切片的步驟,具體為:
根據(jù)所述預(yù)設(shè)字節(jié)長度確定將所述文件切片進行切分的子切片個數(shù)N;
按照時序數(shù)據(jù)的測量對象標識進行哈希計算,對哈希計算的結(jié)果取N的余數(shù)后加一,獲得時序數(shù)據(jù)對應(yīng)的切片號;
將切片號相同的時序數(shù)據(jù)合并到一個子切片中,生成N個子切片。
3.一種時序數(shù)據(jù)的分析方法,其特征在于,所述時序數(shù)據(jù)采用權(quán)利要求1至2任一方法進行存儲,所述分析方法包括:
對接收到的SQL語句進行解析,獲得查詢時序數(shù)據(jù)的時間范圍及對應(yīng)的執(zhí)行計劃;
按照所述時間范圍掃描所述HBase數(shù)據(jù)庫,定位到若干時序數(shù)據(jù)切片,并讀取各所述時序數(shù)據(jù)切片的Value,生成Spark RDD;
根據(jù)所述執(zhí)行計劃對所述Spark RDD進行匹配和過濾操作,獲得與所述執(zhí)行計劃一致的最小數(shù)據(jù)集Minimal DataFrame;
基于所述Minimal DataFrame進行SQL計算。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述讀取各所述時序數(shù)據(jù)切片的Value,生成Spark RDD的步驟,具體為:
利用newHadoopApi以Key-Value的形式讀取各所述時序數(shù)據(jù)切片的Value,生成SparkRDD。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述執(zhí)行計劃對所述Spark RDD進行匹配和過濾操作,獲得與所述執(zhí)行計劃一致的最小數(shù)據(jù)集Minimal DataFrame的步驟,具體為:
根據(jù)所述執(zhí)行計劃對所述Spark RDD進行Value匹配,獲得第一RDD;
根據(jù)所述執(zhí)行計劃對所述第一RDD進行過濾,過濾掉無用字段,獲得第二RDD;
將所述第二RDD注冊為DataFrame。
6.一種時序數(shù)據(jù)的存儲裝置,其特征在于,包括:
時間精度確定模塊,用于根據(jù)時序數(shù)據(jù)的采樣時間間隔,獲取所述時序數(shù)據(jù)的時間精度;
聚合模塊,用于根據(jù)時序數(shù)據(jù)的時間戳以及時間精度,將時間戳相同、時間精度相同的多個時序數(shù)據(jù)聚合為文件切片;
存儲模塊,用于以時間精度和時間戳為HBase行鍵,將所述文件切片存儲至HBase數(shù)據(jù)庫;
所述以時間精度和時間戳為HBase行鍵,將所述文件切片存儲至HBase數(shù)據(jù)庫的步驟,具體為:
獲取所述文件切片的大小;
若所述文件切片的大小大于預(yù)設(shè)字節(jié)長度,則對所述文件切片作進一步切分,生成多個子切片;
以時間精度、時間戳和子切片的切片號為行鍵,將所述多個子切片存儲至HBase數(shù)據(jù)庫中;
若所述文件切片的大小小于等于預(yù)設(shè)字節(jié)長度,則將所述文件切片對應(yīng)的切片號設(shè)置為零,以時間精度、時間戳和所述文件切片的切片號作為行鍵,將所述文件切片存儲至HBase數(shù)據(jù)庫中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京市天元網(wǎng)絡(luò)技術(shù)股份有限公司,未經(jīng)北京市天元網(wǎng)絡(luò)技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910270612.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





