日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種大數(shù)據(jù)多區(qū)間查詢條件下的基數(shù)估計(jì)方法及裝置有效

專利信息
申請(qǐng)?zhí)枺?/td> 201310484503.6 申請(qǐng)日: 2013-10-16
公開(公告)號(hào): CN103544258B 公開(公告)日: 2016-11-30
發(fā)明(設(shè)計(jì))人: 云曉春;徐小琳;王明華;劉陽;李志輝;吳廣君;王樹鵬;王勇;常為領(lǐng) 申請(qǐng)(專利權(quán))人: 國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;中國(guó)科學(xué)院信息工程研究所
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 北京輕創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 11212 代理人: 楊立
地址: 100029*** 國(guó)省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 數(shù)據(jù) 區(qū)間 查詢 條件下 基數(shù) 估計(jì) 方法 裝置
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及大數(shù)據(jù)計(jì)算領(lǐng)域,特別涉及一種大數(shù)據(jù)多區(qū)間查詢條件下的基數(shù)估計(jì)方法及裝置。

背景技術(shù)

隨著移動(dòng)互聯(lián)網(wǎng)和Web2.0的發(fā)展,全球數(shù)據(jù)量正在驚人的增長(zhǎng):2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB(1ZB=1021字節(jié)),2009年為0.8ZB,2010年為1.2ZB,2011年高達(dá)1.82ZB。IDC預(yù)計(jì)到2020年,全人類會(huì)產(chǎn)生超過40ZB的數(shù)據(jù)。在大數(shù)據(jù)中一類重要的數(shù)據(jù)是結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),主要包括:交易數(shù)據(jù),日志數(shù)據(jù)等。據(jù)了解,淘寶網(wǎng)每日新增的交易數(shù)據(jù)達(dá)10TB,eBay分析平臺(tái)日處理數(shù)據(jù)量高達(dá)100PB,沃爾瑪每小時(shí)有大約2.5PB的數(shù)據(jù)存入數(shù)據(jù)庫。基于日志類數(shù)據(jù)進(jìn)行挖掘、分析可以獲得越來越多的有價(jià)值的信息。如Google?Trends對(duì)用戶上網(wǎng)記錄進(jìn)行統(tǒng)計(jì),成功預(yù)測(cè)流感在全球的擴(kuò)散范圍,其準(zhǔn)確度高達(dá)到97%以上。

多區(qū)間條件大數(shù)據(jù)基數(shù)估算是統(tǒng)計(jì)同時(shí)符合多個(gè)區(qū)間查詢條件下的不同的記錄的個(gè)數(shù),是聚合運(yùn)算、統(tǒng)計(jì)分析的基礎(chǔ)計(jì)算工具,在數(shù)據(jù)分析、網(wǎng)絡(luò)監(jiān)控及數(shù)據(jù)庫優(yōu)化等領(lǐng)域都有廣泛的相關(guān)需求。但是目前的大數(shù)據(jù)分析統(tǒng)計(jì)系統(tǒng)本質(zhì)是一種精確計(jì)算的方法,例如Hadoop為基礎(chǔ)的大數(shù)據(jù)管理系統(tǒng)Hive,pig等通過掃描原始數(shù)據(jù)獲得準(zhǔn)確的計(jì)算值,但是隨著數(shù)據(jù)規(guī)模的增大計(jì)算效率顯著下降。近似查詢是通過降低部分計(jì)算精度,來提高大數(shù)據(jù)的計(jì)算效率。傳統(tǒng)的基數(shù)估算算法,如Linear?Counting、LogLog?Counting、HyperLogLog?Counting、Adaptive?Counting,以及Bloomfilter等能解決簡(jiǎn)單的不同元素個(gè)數(shù)的統(tǒng)計(jì),但是不支持區(qū)間查詢條件下的基數(shù)統(tǒng)計(jì)。實(shí)現(xiàn)多區(qū)間條件下的大數(shù)據(jù)高精度基數(shù)統(tǒng)計(jì)成為本發(fā)明需要解決的核心問題。

發(fā)明內(nèi)容

本發(fā)明所要解決的技術(shù)問題是提供一種大數(shù)據(jù)多區(qū)間查詢條件下的進(jìn)行高精度近似計(jì)算的基數(shù)估計(jì)方法及裝置。

本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種大數(shù)據(jù)多區(qū)間查詢條件下的基數(shù)估計(jì)方法,包括以下步驟:

步驟1:按照數(shù)值屬性對(duì)大數(shù)據(jù)預(yù)先劃分成多個(gè)分區(qū),每個(gè)分區(qū)內(nèi)保存所述大數(shù)據(jù)中的一段數(shù)據(jù)源,各個(gè)分區(qū)之間有序排列;

步驟2:建立樹形索引結(jié)構(gòu),每個(gè)分區(qū)作為樹形索引結(jié)構(gòu)的一個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)用于記錄對(duì)應(yīng)的分區(qū)的最大值和最小值,每個(gè)節(jié)點(diǎn)中設(shè)置數(shù)據(jù)文件和基數(shù)估算器;

步驟3:獲取待寫入樹形索引結(jié)構(gòu)的數(shù)據(jù)源,對(duì)支持區(qū)間查詢條件的數(shù)據(jù)源進(jìn)行倒排索引處理;

步驟4:將經(jīng)過倒排索引處理的數(shù)據(jù)源的相應(yīng)部分分別寫入數(shù)據(jù)文件及基數(shù)估算器內(nèi);

步驟5:根據(jù)區(qū)間查詢條件在樹形索引結(jié)構(gòu)中查詢滿足區(qū)間查詢條件的節(jié)點(diǎn),得到節(jié)點(diǎn)中的基數(shù)估算器,對(duì)基數(shù)估算器中的數(shù)據(jù)源的相應(yīng)部分進(jìn)行邏輯處理,得到基數(shù)估算值。

本發(fā)明的有益效果是:本發(fā)明針對(duì)大數(shù)據(jù)統(tǒng)計(jì)分析中通常使用的多區(qū)間查詢條件,提出一種近似查詢方法,通過降低數(shù)據(jù)的計(jì)算精度提高基數(shù)統(tǒng)計(jì)效率。本發(fā)明在每個(gè)分區(qū)內(nèi)使用了HyperLogLog基數(shù)估算算法,公開的資料和理論證明該算法可以在較小內(nèi)存條件下(5KB),在10億規(guī)模的數(shù)據(jù)中,獲得小于1.14%的計(jì)算誤差,并且,估算器之間的合并不會(huì)降低計(jì)算誤差,因此本發(fā)明同樣可以在任意的多區(qū)間條件下,提供較高計(jì)算精度;

本發(fā)明在任意多區(qū)間查詢條件下,具備較高的查詢效率,適用于大數(shù)據(jù)的在線統(tǒng)計(jì)查詢。本發(fā)明基于分區(qū)信息建立層次化的索引結(jié)構(gòu)RC-Tree,在執(zhí)行具體的查詢操作時(shí)僅在RC-Tree中進(jìn)行檢索,查詢效率與RC-Tree的節(jié)點(diǎn)數(shù)目相關(guān)與具體的數(shù)據(jù)量無關(guān)。在多個(gè)區(qū)間條件下的檢索運(yùn)算,都轉(zhuǎn)化為二進(jìn)制或運(yùn)算,因此都具有較高計(jì)算效率;

本發(fā)明使用了大數(shù)據(jù)增量更新技術(shù)提高索引數(shù)據(jù)在線更新效率。發(fā)明使用臨時(shí)表索引結(jié)構(gòu)保存增量更新的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行合并,當(dāng)?shù)竭_(dá)到一定的數(shù)據(jù)規(guī)模后,把合并以后的數(shù)據(jù)批量更新到全局的索引結(jié)構(gòu)中,并與全局索引進(jìn)行再次合并,提高大數(shù)據(jù)的更新效率。

在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。

進(jìn)一步,所述步驟3具體為:為每個(gè)待寫入的數(shù)據(jù)源分配一個(gè)全局唯一的ID,將每個(gè)數(shù)據(jù)源分別拆分為<value,ID>結(jié)構(gòu)。

進(jìn)一步,所述步驟4具體為:將<value,ID>結(jié)構(gòu)中的value寫入相應(yīng)的節(jié)點(diǎn)內(nèi)的數(shù)據(jù)文件中,ID利用哈希算法寫入節(jié)點(diǎn)內(nèi)的基數(shù)估算器中。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;中國(guó)科學(xué)院信息工程研究所,未經(jīng)國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;中國(guó)科學(xué)院信息工程研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310484503.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 亚洲福利视频二区| 精品亚洲午夜久久久久91| 综合色婷婷一区二区亚洲欧美国产| 日韩精品一区二区三区免费观看| 日本中文字幕一区| 欧美在线播放一区| 国产欧美日韩精品一区二区三区 | 亚洲精品国产综合| 久久国产中文字幕| 一区二区三区四区中文字幕| 国产69精品久久777的优势| 国语对白一区二区三区| 色婷婷噜噜久久国产精品12p| 欧美一级不卡| 在线电影一区二区| 欧美精品免费一区二区| 国产精品乱战久久久| 午夜影院激情| 性欧美精品动漫| 午夜伦全在线观看| 国产亚洲精品久久久久久网站| 99爱精品在线| 视频一区欧美| 99精品一区| 日韩av在线播放网址| 天天射欧美| 亚洲精品91久久久久久| 欧美一区二区三区久久综合| 久久99久久99精品免观看软件| 亚洲四区在线| 国产一区日韩在线| 国产videosfree性另类| 99久久国产综合| 欧美一区二区三区久久久| 欧美一区二区色| 亚洲激情中文字幕| 日本一二三区视频在线| 国产精品久久久麻豆| 日韩精品一区中文字幕| 欧美高清性xxxx| 国产精品一区在线观看你懂的| 国产欧美综合一区| 99精品视频一区| 国产精品女人精品久久久天天| 欧美日韩中文字幕一区二区三区 | 久久久久久久久久国产精品| 91婷婷精品国产综合久久| 精品国产免费久久| 99久久精品一区字幕狠狠婷婷| 国产精品日韩电影| 国产伦高清一区二区三区| 色综合久久久| 国产精品三级久久久久久电影| 91视频国产一区| 国产欧美一区二区三区免费视频| 国产一区午夜| www.久久精品视频| 猛男大粗猛爽h男人味| 欧美高清视频一区二区三区| 国产视频在线一区二区| 午夜老司机电影| 少妇高潮大叫喷水| 狠狠躁夜夜躁xxxxaaaa| 九色国产精品入口| 国产在线拍揄自揄拍| av素人在线| 国产69精品99久久久久久宅男| 亚洲欧美另类综合| 亚洲视频精品一区 | 欧美日本一二三区| 久久人人爽爽| 欧美日韩国产三区| 又黄又爽又刺激久久久久亚洲精品 | www色视频岛国| 日韩av一区二区在线播放 | 久久69视频| 久久综合伊人77777麻豆| 精品国产品香蕉在线| 国产午夜亚洲精品午夜鲁丝片| 久久久精品免费看| 国产一区二区电影| 97久久国产精品| 精品国产伦一区二区三区免费| 国产欧美精品一区二区三区小说| 国产午夜精品一区二区理论影院 | 久久国产精品二区| 久久一区二区视频| 国产一区二区精品免费| www.午夜av| 欧美日本一二三区| 国产欧美一区二区三区精品观看| 欧美精品国产精品| 国产精品综合在线| 国产精品日韩一区二区三区| 丰满岳妇伦4在线观看| 神马久久av| 欧美一区二区三区激情在线视频| 狠狠色噜噜狠狠狠狠2021天天| 538在线一区二区精品国产| 久久精品国产一区二区三区| 欧美日韩卡一卡二| 国产清纯白嫩初高生在线播放性色| 欧美福利三区| 欧洲亚洲国产一区二区三区| 午夜伦全在线观看| 国产白嫩美女在线观看| 国产91九色在线播放| 欧美日韩一区二区三区69堂| 欧美性二区| 免费久久99精品国产婷婷六月| 精品国产乱码一区二区三区a| 精品国产乱码久久久久久老虎| 国产乱淫精品一区二区三区毛片| 欧美乱妇在线观看| 欧美在线播放一区| 久久久久久久久久国产精品| 中文字幕国内精品| 国产精品天堂网| 欧洲激情一区二区| 丰满少妇高潮惨叫久久久一| 少妇久久免费视频| 欧美黄色片一区二区| 搡少妇在线视频中文字幕| 中文av一区| 欧美高清xxxxx| xxxx18日本护士高清hd| 国产特级淫片免费看| 日本一二三四区视频| 香蕉av一区二区三区| 国产精品久久久久久一区二区三区| 精品国产一区二区三区在线| 欧美国产三区| 中文字幕在线一二三区| 毛片大全免费观看| 国产人成看黄久久久久久久久| 午夜a电影| 福利片一区二区三区| 黄色香港三级三级三级| 精品免费久久久久久久苍| 精品国产二区三区| 国产精品视频免费一区二区| 少妇久久精品一区二区夜夜嗨| 国产精品19乱码一区二区三区| 国产精品亚洲欧美日韩一区在线| 日本一区二区三区免费视频| 日韩精品久久久久久久的张开腿让| 欧美精品一卡二卡| 最新国产一区二区| 国产精品日韩在线观看| 国产精品伦一区二区三区在线观看| 国产精品美女久久久另类人妖| 久久精品国产一区二区三区不卡| 中日韩欧美一级毛片| 天干天干天啪啪夜爽爽99| 久久国产欧美日韩精品| 欧美视屏一区| 亚洲国产日韩综合久久精品 | 国产一区二区麻豆| 午夜精品999| 精品国产一区二区三区忘忧草| 国91精品久久久久9999不卡| 一区二区久久精品66国产精品| 狠狠插影院| 久久久久国产亚洲日本| 伊人久久婷婷色综合98网| 久久精品视频3| 一区二区三区国产欧美| 久久99精| 国产精品国产亚洲精品看不卡15| 5g影院天天爽入口入口| 日本高清不卡二区| 福利片91| 国产精品电影一区二区三区| 中文字幕欧美一区二区三区| 欧美一区二区三区免费看| 91福利视频免费观看| 亚洲国产精品精品| 欧美xxxxxhd| 蜜臀久久99精品久久久久久网站| 欧美大成色www永久网站婷| 日韩av在线播| www.久久精品视频| 国产欧美一区二区在线| 国产偷自视频区视频一区二区| 热久久国产| 一区二区三区欧美精品| 午夜影院啪啪| 欧美三级午夜理伦三级中视频| 日韩久久精品一区二区| 亚洲美女在线一区| 日本伦精品一区二区三区免费| 97人人澡人人添人人爽超碰| 日韩午夜电影院| 少妇自拍一区| 国产视频二区| free性欧美hd另类丰满| 久久一级精品| 国产69精品久久99不卡解锁版| 日韩精品中文字幕一区二区| 欧美精品xxxxx| 国产欧美日韩精品一区二区三区| 亚洲一区精品视频| 国产精品一二三四五区| 国产91一区| 国产不卡一二三区| 欧美色图视频一区| 日韩一区二区中文字幕| 国产精品对白刺激久久久| 中文字幕一区二区三区不卡| 亚洲一二区在线观看| 欧美一级片一区| 日韩精品一区二区中文字幕| 国产97久久| 欧美在线视频三区| 国产伦精品一区二| 国产婷婷一区二区三区久久| 国产亚洲精品久久19p| 国产一区二区在线91| 欧美一区二区三区激情在线视频| 青苹果av| 亚洲一二三在线| 亚洲国产午夜片| 综合久久一区二区三区| 午夜电影网一区| 国产精品国精产品一二三区| 999久久久国产精品| 国产精品久久久久久久妇女| 亚洲国产99| 国产精品精品视频一区二区三区 | 国产91久| 亚洲欧美日本一区二区三区| 美女直播一区二区三区| 精品久久久久一区二区| 亚洲一二区在线观看| 福利视频亚洲一区| 精品国产1区2区| 夜夜爱av| 91精品国产影片一区二区三区| 欧美精品国产一区二区| 国产精一区二区三区| 中文字幕日本一区二区| 国产一区2区3区| 国产精品尤物麻豆一区二区三区 | 欧美日韩精品在线一区二区| 日本三级香港三级| 精品99免费视频|