[發(fā)明專利]一種多維區(qū)間查詢方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201010205946.3 | 申請(qǐng)日: | 2010-06-12 |
| 公開(公告)號(hào): | CN101866358A | 公開(公告)日: | 2010-10-20 |
| 發(fā)明(設(shè)計(jì))人: | 鄒永強(qiáng);劉佳;查禮;王世才 | 申請(qǐng)(專利權(quán))人: | 中國科學(xué)院計(jì)算技術(shù)研究所 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京律誠同業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多維 區(qū)間 查詢 方法 系統(tǒng) | ||
1.一種多維區(qū)間查詢方法,其特征在于,包括:
步驟1,將用于備份數(shù)據(jù)的副本組織成為多份互為補(bǔ)充和校驗(yàn)的互補(bǔ)聚簇索引表;互補(bǔ)聚簇索引表以每個(gè)索引列創(chuàng)建一張以列值加原行主鍵加列值長度為新主鍵的順序表,并將原行中其余列的數(shù)據(jù)完整存儲(chǔ);互補(bǔ)聚簇索引表用于供查詢時(shí)進(jìn)行連續(xù)掃描;
步驟2,將查詢串轉(zhuǎn)換為查詢計(jì)劃樹,進(jìn)行查詢優(yōu)化后完成查詢的執(zhí)行。
2.如權(quán)利要求1所述的多維區(qū)間查詢方法,其特征在于,步驟1中,互補(bǔ)聚簇索引表包含原數(shù)據(jù)表中所有的數(shù)據(jù);底層文件系統(tǒng)的備份策略處于關(guān)閉的狀態(tài)。
3.如權(quán)利要求1所述的多維區(qū)間查詢方法,其特征在于,步驟2中,查詢優(yōu)化時(shí),先對(duì)查詢語句進(jìn)行去重合并,然后基于分布式順序表的分片信息對(duì)子查詢結(jié)果集的大小進(jìn)行估算,最后挑選結(jié)果集最小的子查詢執(zhí)行查詢過程。
4.如權(quán)利要求1所述的多維區(qū)間查詢方法,其特征在于,查詢計(jì)劃樹的每個(gè)葉子節(jié)點(diǎn)是能被直接處理的點(diǎn)查詢和單個(gè)維度的區(qū)間查詢,查詢計(jì)劃樹的非葉子節(jié)點(diǎn)表示多個(gè)查詢的邏輯關(guān)系。
5.如權(quán)利要求3所述的多維區(qū)間查詢方法,其特征在于,估算子查詢結(jié)果集的大小具體包括:
步驟21,對(duì)于每個(gè)給定的區(qū)間查詢,由其起始鍵值和結(jié)束鍵值通過對(duì)元信息中數(shù)據(jù)的查找確定此區(qū)間查詢覆蓋的分片數(shù)量;
步驟22,對(duì)于被完全覆蓋的分片,按分片平均大小估算其大小;對(duì)于被部分覆蓋的分片,根據(jù)按照該分片被覆蓋的比例計(jì)算該分片大小;
步驟23,累加全部分片的大小,獲得估算的結(jié)果集大小;
步驟24,當(dāng)兩個(gè)子查詢包含的分片數(shù)相等且結(jié)果集大小相等時(shí),比較查詢區(qū)間的字符串距離,用所述字符串距離來估算子查詢結(jié)果集的大小。
6.如權(quán)利要求1所述的多維區(qū)間查詢方法,其特征在于,還包括下述步驟:
步驟3,建立互補(bǔ)校驗(yàn)表,互補(bǔ)校驗(yàn)表中按照各個(gè)互補(bǔ)聚簇索引表的主鍵存儲(chǔ)了全部索引列的值,同時(shí)屏蔽底層文件系統(tǒng)的備份策略;當(dāng)互補(bǔ)聚簇索引表發(fā)生數(shù)據(jù)缺失時(shí)通過互補(bǔ)校驗(yàn)表中保存的主鍵對(duì)應(yīng)關(guān)系從其它互補(bǔ)聚簇索引表中恢復(fù)缺失的數(shù)據(jù)。
7.一種多維區(qū)間查詢系統(tǒng),其特征在于,包括:
存儲(chǔ)節(jié)點(diǎn),用于將用于備份數(shù)據(jù)的副本組織成為多份互為補(bǔ)充和校驗(yàn)的互補(bǔ)聚簇索引表;互補(bǔ)聚簇索引表以每個(gè)索引列創(chuàng)建一張以列值加原行主鍵加列值長度為新主鍵的順序表,并將原行中其余列的數(shù)據(jù)完整存儲(chǔ);互補(bǔ)聚簇索引表用于供查詢時(shí)進(jìn)行連續(xù)掃描;存儲(chǔ)節(jié)點(diǎn)將互補(bǔ)聚簇索引表的分片在物理上分布式的存儲(chǔ);
客戶端,用于將查詢串轉(zhuǎn)換為查詢計(jì)劃樹,進(jìn)行查詢優(yōu)化后完成查詢的執(zhí)行。
8.如權(quán)利要求7所述的多維區(qū)間查詢系統(tǒng),其特征在于,
所述互補(bǔ)聚簇索引表包含原數(shù)據(jù)表中所有的數(shù)據(jù);底層文件系統(tǒng)的備份策略處于關(guān)閉的狀態(tài)。
9.如權(quán)利要求7所述的多維區(qū)間查詢系統(tǒng),其特征在于,
所述系統(tǒng)還包括服務(wù)節(jié)點(diǎn),所述服務(wù)節(jié)點(diǎn)用于存儲(chǔ)分布式順序表的元信息,元信息中包含分片與存儲(chǔ)節(jié)點(diǎn)的對(duì)應(yīng)關(guān)系,
所述客戶端在查詢優(yōu)化時(shí)進(jìn)一步用于先對(duì)查詢語句進(jìn)行去重合并,然后基于所述分布式順序表的分片信息對(duì)子查詢結(jié)果集的大小進(jìn)行估算,最后挑選結(jié)果集最小的子查詢請(qǐng)求存儲(chǔ)節(jié)點(diǎn)執(zhí)行查詢過程。
10.如權(quán)利要求7所述的多維區(qū)間查詢系統(tǒng),其特征在于,
查詢計(jì)劃樹的每個(gè)葉子節(jié)點(diǎn)是能被存儲(chǔ)節(jié)點(diǎn)直接處理的點(diǎn)查詢和單個(gè)維度的區(qū)間查詢,查詢計(jì)劃樹的非葉子節(jié)點(diǎn)表示多個(gè)查詢的邏輯關(guān)系。
11.如權(quán)利要求9所述的多維區(qū)間查詢系統(tǒng),其特征在于,
所述客戶端在估算子查詢結(jié)果集的大小時(shí)進(jìn)一步用于對(duì)于每個(gè)給定的區(qū)間查詢,由其起始鍵值和結(jié)束鍵值通過對(duì)元信息中數(shù)據(jù)的查找確定此區(qū)間查詢覆蓋的分片數(shù)量;對(duì)于被完全覆蓋的分片,按分片平均大小估算其大小;對(duì)于被部分覆蓋的分片,根據(jù)按照該分片被覆蓋的比例計(jì)算該分片大小;累加全部分片的大小,獲得估算的結(jié)果集大小;當(dāng)兩個(gè)子查詢包含的分片數(shù)相等且結(jié)果集大小相等時(shí),比較查詢區(qū)間的字符串距離,用所述字符串距離來估算子查詢結(jié)果集的大小。
12.如權(quán)利要求7所述的多維區(qū)間查詢系統(tǒng),其特征在于,
所述存儲(chǔ)節(jié)點(diǎn)還用于建立互補(bǔ)校驗(yàn)表,互補(bǔ)校驗(yàn)表中按照各個(gè)互補(bǔ)聚簇索引表的主鍵存儲(chǔ)了全部索引列的值,同時(shí)屏蔽底層文件系統(tǒng)的備份策略;當(dāng)發(fā)現(xiàn)互補(bǔ)聚簇索引表發(fā)生數(shù)據(jù)缺失時(shí)通過互補(bǔ)校驗(yàn)表中保存的主鍵對(duì)應(yīng)關(guān)系從其它互補(bǔ)聚簇索引表中恢復(fù)缺失的數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院計(jì)算技術(shù)研究所,未經(jīng)中國科學(xué)院計(jì)算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010205946.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 多維、多元生命水及其用途
- 一種多維地址域名解析的方法和裝置以及系統(tǒng)
- 創(chuàng)建多維操作系統(tǒng)的方法和裝置
- 一種對(duì)多維地址數(shù)據(jù)進(jìn)行解析的方法和裝置以及系統(tǒng)
- 一種分組的交付和路由選擇的方法和裝置以及系統(tǒng)
- 多維碼處理方法、發(fā)送端、接收端和系統(tǒng)
- 多維度信息展示方法及裝置
- 一種屏幕可視化方法、裝置、電子設(shè)備及介質(zhì)
- 多維數(shù)據(jù)集的生成方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 多維時(shí)空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種區(qū)間值存儲(chǔ)方法及裝置、路由器
- 宣傳區(qū)間檢測(cè)裝置以及宣傳區(qū)間檢測(cè)方法
- 興趣區(qū)間抽取裝置、興趣區(qū)間抽取方法
- 區(qū)間制作裝置、區(qū)間制作方法、及區(qū)間制作程序
- 區(qū)間取得系統(tǒng)、區(qū)間取得方法以及區(qū)間取得程序
- 區(qū)間決定裝置及區(qū)間決定方法
- 區(qū)間決定裝置及區(qū)間決定方法
- 機(jī)器人控制裝置、機(jī)器人控制方法和存儲(chǔ)介質(zhì)
- 機(jī)器人控制裝置、機(jī)器人控制方法和存儲(chǔ)介質(zhì)
- 一種三端口拓?fù)潆娐返恼{(diào)制方法
- 帶有前處理和后處理的數(shù)據(jù)庫復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語言的查詢方法及查詢系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





