[發明專利]用于列表數據壓縮的多重分類有效
| 申請號: | 201380017113.6 | 申請日: | 2013-03-13 |
| 公開(公告)號: | CN104205065B | 公開(公告)日: | 2017-09-29 |
| 發明(設計)人: | J·阿米特;L·德米多夫;N·哈洛瓦尼;S·馬倫科夫 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F12/00 | 分類號: | G06F12/00;G06F5/00;G06F17/30 |
| 代理公司: | 北京市金杜律師事務所11256 | 代理人: | 酆迅,張凡 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 列表 數據壓縮 多重 分類 | ||
技術領域
本發明一般地涉及計算機,并且更具體地涉及計算環境中的用于列表數據壓縮的多重分類。
背景技術
在如今的社會中,計算機系統司空見慣。可以在工作地點、在家里或者在學校找到計算機系統。計算機系統可以包括用于處理和存儲數據的數據存儲系統或者盤存儲系統。利用數據存儲系統或者盤存儲系統以處理和存儲數據。存儲系統可以包括一個或者多個盤驅動。這些數據處理系統通常需要大量數據存儲。客戶數據或者用戶在數據處理系統內生成的數據占用該數據存儲的大部分。這些計算機系統中的許多計算機系統包括虛擬存儲部件。
計算系統用來存儲和管理各種類型的數據,諸如列表數據(Tabular data)。列表數據通常被組織成行和列以形成例如如在關系表、字處理文檔、電子表格或者電子表格式結構或者相似數據庫結構中使用的常見表。這些表的形成包括用于行和列的多種組織的陣列和排列。然而,列表數據的實際物理存儲可以采用多種形式。例如,雖然列表數據的邏輯結構可以是多維的,但是列表數據可以在物理上按線性格式來存儲,諸如按照以行為主或者以列為主的格式。按以行為主的格式,來自表式結構的行的列值鄰接地被存儲于持久存儲裝置中。對照而言,按以列為主的格式,對于給定的列的多個行,鄰接地存儲該列的列值。
數據壓縮廣泛地用來減少為了處理、傳輸或者存儲給定數量的信息而需要的數據數量。數據壓縮是對數據進行編碼以最小化它的表示。壓縮可以例如用來減少用于文件的存儲要求、增加通過信道的通信速率或者在加密之前減少冗余性以求更大安全性。列表數據結構也將從數據壓縮中受益,因為數據壓縮對減少昂貴資源、諸如硬盤空間或者傳輸帶寬的消耗是有用的。
發明內容
技術問題
由于數據存儲昂貴,所以明顯地希望最小化為了存儲結構化數據而需要的存儲數量。此外,在存儲位置之間復制或者傳送數據序列時,希望最小化在數據庫字段內在CPU周期、網絡使用等方面的開銷,已經對用于維護數據副本的技術進行了大量研究。在列表數據中,獨立地壓縮每列將提供比用一個流壓縮整個表更高的壓縮比。壓縮比增加的原因在于每列中的數據相對地同質。然而,存儲控制器不了解列表結構,因為它們不能應用列壓縮算法并且不能從增加的壓縮比中受益。作為結果,可能降低效率和生產率。
對問題的解決方案
因而并且鑒于前文,提供用于列表數據壓縮的多重分類的各種示例方法、系統和計算機程序產品實施例。在一個實施例中,將相似類型的數據段分類成各類別,用于將數據段分組成與這些類別中的每個類別關聯的壓縮流。基于類列特定的優化編碼操作對壓縮流進行編碼。壓縮流進入一個輸出緩沖器,其中該壓縮流被提取。
除了前述示例方法實施例之外,還提供其它示例系統和計算機產品實施例,并且這些其它示例系統和計算機產品實施例提供有關優點。已經提供了前述發明內容以用簡化形式介紹以下在具體實施方式中進一步描述的概念的選集。本發明內容不旨在于標識要求保護的主題內容的關鍵特征或者必需特征,它也不旨在于用作輔助確定要求保護的主題內容的范圍。要求保護的主題內容不限于解決在背景技術中指出的任何或者所有缺點的實現方式。
為了容易理解本發明的優點,將通過參照在附圖中圖示的具體實施例來表現以上簡要地描述的本發明的更具體描述。將理解這些附圖描繪本發明的實施例,并因此不被視為限制其范圍,將通過使用附圖、利用附加特點和細節來描述和解釋本發明。
附圖說明
[圖1]圖1圖示計算機存儲環境,該計算機存儲環境具有其中可以實現本發明的方面的示例存儲設備。
[圖2]圖2圖示示出在其中可以實現本發明的方面的計算機系統中的數據存儲系統的硬件結構的示例框圖。
[圖3]圖3是圖示用于列表數據壓縮的多重分類的示例方法的流程圖。
[圖4]圖4圖示示出多重分類基本壓縮的示例框圖。
[圖5]圖5圖示示出其中可以實現本發明的方面的復用輸出緩沖器的示例框圖。
[圖6]圖6圖示示出用于其中可以實現本發明的方面的列表數據壓縮緩沖器的多重分類的示例框圖。
[圖7]圖7是圖示用于對用于列表數據壓縮的多重分類進行編碼的示例方法的流程圖。
[圖8]圖8是圖示用于將多重分類數據提取回原有的處理前輸入數據塊的示例方法的流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380017113.6/2.html,轉載請聲明來源鉆瓜專利網。





