[發明專利]拷貝卷中存儲的數據的去重復有效
| 申請號: | 200980158509.6 | 申請日: | 2009-03-30 |
| 公開(公告)號: | CN102378969A | 公開(公告)日: | 2012-03-14 |
| 發明(設計)人: | S.H.卡帕尼帕蒂;S.班加洛雷哈沙瓦哈納;R.肯南;T.文古爾勒卡 | 申請(專利權)人: | 惠普開發有限公司 |
| 主分類號: | G06F12/16 | 分類號: | G06F12/16;G06F17/30;G06F11/14 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 劉春元;盧江 |
| 地址: | 美國德*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 拷貝 存儲 數據 重復 | ||
背景技術
隨著存儲技術的發展,可存儲在存儲子系統(包括硬盤驅動器、盤陣列系統等)的數據量已經極大增長。可以出于各種目的保持存儲子系統中的數據的拷貝,這些目的包括數據備份、數據挖掘(其中,對數據進行分析以提供對數據的更好理解)等。
存在不同類型的拷貝,包括快照和克隆。快照是數據的時間點表示。快照包含已經由于一個或多個寫入操作而改變的源存儲卷的數據塊(注意,不將源存儲卷中未改變的數據拷貝至快照)。響應于對源存儲卷中的數據進行修改的寫入,在寫入到源存儲卷之前,將原始數據拷貝至快照。
另一種類型的拷貝是克隆,其包含源存儲卷的完全拷貝,包括源存儲卷的未被修改的數據。
與保持快照和/或克隆相關聯的問題是它們可能在存儲空間方面是低效的。一般地,快照比克隆更加空間高效。然而,隨著快照老化(age),快照的存儲空間利用率也提高,這可能導致存儲空間使用率更加低效。存儲空間使用率低效的一個原因是快照和/或克隆可能包含相對較大的重復數據量。
附圖說明
參照以下附圖來描述本發明的一些實施例:
圖1是根據一個實施例的包括源卷、拷貝卷以及包含允許對重復數據進行檢測的信息的去重復數據結構的布置的示意圖;
圖2A至2C示意了根據一個實施例的導致快照卷更新的對源卷執行的寫入的示例;
圖3示意了根據一個實施例的允許對重復數據的標識的根據一個實施例的散列表;
圖4示意了根據一個實施例的導致快照更新的對源卷執行的寫入的另一示例;
圖5是根據一個實施例的、數據從源卷至快照卷的空間高效拷貝過程的流程圖;
圖6是根據一個實施例的要被執行以在快照卷中提供數據冗余的附加任務的流程圖;
圖7示意了根據另一實施例的散列表;
圖8示意了根據一個實施例的、重復數據在快照卷中的存儲;
圖9是根據另一實施例的要被執行以在快照卷中提供數據冗余的附加任務的流程圖;
圖10是根據一個實施例的包括源卷、快照卷以及用于實現快照卷中存儲的數據的去重復的數據字典的布置的示意圖;
圖11是根據另一實施例的、數據從源卷至快照卷的空間高效拷貝過程的流程圖;以及
圖12是可結合一些實施例的存儲子系統的框圖。
具體實施方式
在根據一個實施例的存儲子系統中,如圖1所示,針對源卷100保持至少一個拷貝卷102,其中,拷貝卷102包含通過對源卷的一個或多個寫入操作而進行的修改前的數據版本。“卷”指代存儲子系統中包含的邏輯數據單元。“源卷”指代通常對其執行輸入/輸出(I/O)操作(包括讀取、寫入、刪除等)的邏輯數據單元。“拷貝卷”指代包含源卷中存儲的數據版本的邏輯數據單元,其中,數據的“版本”指代數據的先前版本(在由于寫入操作而進行的修改之前)和/或源卷中的數據的重復拷貝。可以出于各種目的在存儲子系統中提供拷貝卷102,這些目的包括數據備份(在損壞、錯誤或故障的情況下實現數據恢復)、數據挖掘(允許對數據進行分析以更好地理解數據)和/或其他目的。
在一些示例中,拷貝卷102可以是快照或克隆。快照包含已經由于一個或多個寫入操作而改變的源卷100的數據塊(注意,不將源卷100中未改變的數據拷貝至快照)。響應于對源卷中的數據塊進行修改的寫入,在寫入到源卷之前,將原始數據塊拷貝至快照。
克隆包含源卷100的完全拷貝。除了存儲源卷100中已通過寫入操作而修改的原始數據塊之外,克隆還存儲源卷中未被修改的數據塊的拷貝。
盡管僅示出了一個源卷100和一個拷貝卷102,但是需要注意,可以存在多個源卷100和/或拷貝卷102。
如圖1所示,源卷100包括數據塊b1、b2、b3和b4,而拷貝卷102包括數據塊s1、s2、s3和s4。“數據塊”(或更簡單地,“塊”)指代卷中數據的分區,其中,該分區具有預定義大小(或具有各種大小)。盡管在源卷100和拷貝卷102中的每一個中僅繪出4個塊,但是需要注意,可以在每個卷中提供更多塊。在一個示例中,如果將通過寫入操作來修改源卷100中的數據塊b2,則可將寫入操作完成前數據塊b2中的原始數據拷貝至拷貝卷102中的對應數據塊s2。將這種將數據從源卷拷貝至拷貝卷的拷貝作為“拷貝操作”的一部分來執行。拷貝操作可以是寫入時拷貝操作或寫入前拷貝操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于惠普開發有限公司,未經惠普開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200980158509.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





