[發明專利]位圖索引壓縮方法和位圖索引解壓方法有效
| 申請號: | 201410240532.2 | 申請日: | 2014-05-30 |
| 公開(公告)號: | CN103995887B | 公開(公告)日: | 2017-04-05 |
| 發明(設計)人: | 彭青松;朱仲穎;汪龍重 | 申請(專利權)人: | 上海達夢數據庫有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 鄧猛烈,孟金喆 |
| 地址: | 201203 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 位圖 索引 壓縮 方法 解壓 | ||
技術領域
本發明實施例涉及數據庫技術領域,尤其涉及一種位圖索引壓縮方法和位圖索引解壓方法。
背景技術
隨著計算機信息技術的快速發展,越來越多的用戶對海量數據的存儲和檢索提出了更高的要求。位圖索引對應于數據基表中的索引關鍵字,位圖索引在海量數據上的應用是普遍的,例如在數據基表上通過位圖索引檢索某個產品在某個時間段的銷售情況等等。在提升位圖索引檢索性能的同時,對位圖索引存儲空間的要求也越來越高,因此位圖索引壓縮技術應運而生。
現有的位圖索引壓縮技術,一般是通過計算數據基表的索引關鍵字對應的位圖索引中每個1之前的0的個數,并確定該個數的二進制表示位數,同時通過添加控制信息對該個數的二進制表示位數以及該個數的二進制數進行編碼,從而實現數據基表的索引關鍵字對應的位圖索引的壓縮存儲。
上述位圖索引壓縮技術的缺陷在于:雖然通過將每個1前面的0的個數用相應位數的二進制記錄,可以減少每個1前面的0的個數的存儲空間,但在編碼中添加的控制信息會導致位圖索引的存儲空間的增大;而且復雜的編碼方式增加了位圖索引的解壓復雜度,從而影響位圖索引的檢索查詢效率。
發明內容
本發明實施例提供一種位圖索引壓縮方法及裝置,以減小位圖索引的存儲空間;本發明實施例還提供一種位圖索引解壓方法及裝置,以降低位圖索引的解壓復雜度,以提高位圖索引的檢索查詢效率。
第一方面,本發明實施例提供了一種位圖索引壓縮方法,包括:
對于預先建立的數據基表中所包含的索引關鍵字的位圖索引,將該位圖索引按預設段寬度分段,得到多段位圖信息;
對于各段位圖信息,確定該段位圖信息中各有效值的偏移值,其中,所述偏移值為對應的有效值在該段位圖信息中的位數;根據各有效值的偏移值確定各偏移值的二進制存儲位數;根據所述二進制存儲位數得到該段位圖信息中各偏移值的二進制表示信息,生成并存儲該段位圖信息的壓縮信息,該壓縮信息包含各偏移值的二進制表示信息。
第二方面,本發明實施例提供了一種位圖索引壓縮裝置,包括:
分段模塊,用于對于預先建立的數據基表中所包含的索引關鍵字的位圖索引,將該位圖索引按預設段寬度分段,得到多段位圖信息;
偏移值確定模塊,用于對于各段位圖信息,確定該段位圖信息中各有效值的偏移值,其中,所述偏移值為對應的有效值在該段位圖信息中的位數;
二進制存儲位數確定模塊,用于根據各有效值的偏移值確定各偏移值的二進制存儲位數;
第一存儲模塊,用于根據所述二進制存儲位數得到該段位圖信息中各偏移值的二進制表示信息,生成并存儲該段位圖信息的壓縮信息,該壓縮信息包含各偏移值的二進制表示信息。
第三方面,本發明實施例提供了一種位圖索引解壓方法,包括:
獲取數據基表中所包含的索引關鍵字的位圖索引的各段位圖信息的壓縮信息,其中,所述各段位圖信息通過將該位圖索引按預設段寬度分段獲得,對于各段位圖信息的壓縮信息,該段位圖信息的壓縮信息包含二進制表示信息和二進制存儲位數,所述二進制表示信息包含該段位圖信息中各有效值的偏移值的二進制表示信息;所述二進制存儲位數包含該段位圖信息中各有效值的偏移值的二進制表示信息的存儲位數,所述偏移值為對應的有效值在該段位圖信息中的位數;
對于各段位圖信息的壓縮信息,生成寬度為預設段寬度的初始化位圖信息;根據該段位圖信息的壓縮信息中的二進制存儲位數,將該段位圖信息的壓縮信息中的二進制表示信息轉換為十進制信息,得到該段位圖信息的壓縮信息中各有效值的偏移值;通過將所述初始化位圖信息中各有效值的偏移值對應的位設置為有效值,得到該段位圖信息的壓縮信息對應的解壓信息。
第四方面,本發明實施例提供了一種位圖索引解壓裝置,包括:
壓縮信息獲取模塊,用于獲取數據基表中所包含的索引關鍵字的位圖索引的各段位圖信息的壓縮信息,其中,所述各段位圖信息通過將該位圖索引按預設段寬度分段獲得,對于各段位圖信息的壓縮信息,該段位圖信息的壓縮信息包含二進制表示信息和二進制存儲位數,所述二進制表示信息包含該段位圖信息中各有效值的偏移值的二進制表示信息;所述二進制存儲位數包含該段位圖信息中各有效值的偏移值的二進制表示信息的存儲位數,所述偏移值為對應的有效值在該段位圖信息中的位數;
初始化位圖信息生成模塊,用于對于各段位圖信息的壓縮信息,生成寬度為預設段寬度的初始化位圖信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海達夢數據庫有限公司,未經上海達夢數據庫有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410240532.2/2.html,轉載請聲明來源鉆瓜專利網。





