[發明專利]利用了數據段的相似度的高效數據存儲有效
| 申請號: | 200780021765.1 | 申請日: | 2007-04-11 |
| 公開(公告)號: | CN101467148A | 公開(公告)日: | 2009-06-24 |
| 發明(設計)人: | K·李;M·B·朱;U·馬赫什沃里;Z·楊 | 申請(專利權)人: | 數據域公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 | 代理人: | 馬永利;劉春元 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 數據 相似 高效 存儲 | ||
發明背景
一種高效地存儲數據的方法是防止對于在備份之間保持不變的數 據的冗余拷貝。這種高效的存儲是通過把來自各數據源的數據流分成段 (segment)并且把所述段以及所述段的標識符的索引存儲在存儲設備上 來實現的。在后續的備份操作期間,再次對所述數據流進行分段,并且 在所述索引中查找所述段以便確定某一數據段先前是否已被存儲過。如 果找到完全相同的段,則不再存儲該數據段;否則就存儲所述新的數據 段和新的索引標識符。遺憾的是,隨著將要備份的數據量的增加,所述 段的數目(如果所述段的尺寸近似的話)以及所述索引條目的數目也會 增加。所述段和索引條目的數目的增加會導致存取性能的降低:對于寫 入,必須把到來的段索引與所述索引中的所有條目進行比較;以及對于 讀取,必須從較大數目的段當中檢索與某一文件相關聯的段。如果增大 所述段的尺寸,則會減少所述段的數目,從而所述索引條目的數目也會 減少,性能也可以得到保持;然而,由于出現較長的完全相同的段的幾 率沒有那么高,因此存儲效率會降低。如果可以在不犧牲存儲效率的情 況下保持存取性能,則將是有益的。
附圖簡述
在下面的詳細描述和附圖中公開了本發明的各種實施例。
圖1是示出利用數據段的相似度進行高效存儲的系統的一個實施例 的方框圖。
圖2是示出利用數據段的相似度進行高效存儲的處理的一個實施例 的方框圖。
圖3是示出寫入期間的內容存儲過程的一個實施例的流程圖。
圖4是示出用于生成邏輯段以及計算概要特征集合的過程的一個實 施例的流程圖。
圖5是示出讀取期間的內容存儲過程的一個實施例的流程圖。
圖6是示出寫入期間的段存儲過程的一個實施例的流程圖。
圖7是示出相似度確定過程的一個實施例的流程圖。
圖8是示出針對讀取的段存儲過程的一個實施例的流程圖。
詳細描述
可以按照多種方式來實施本發明,其中包括把本發明實施為一種過 程、設備、系統、物質構成、計算機可讀介質(比如計算機可讀存儲介 質)或者計算機網絡(其中通過光學或電子通信鏈路來發送程序指令)。 在本說明書中,這些實施方式或者本發明所能采取的任何其他形式都可 以被稱作技術。諸如被描述為被配置成執行任務的處理器或存儲器之類 的組件包括通用組件或專用組件,其中所述通用組件在給定時間被臨時 配置成執行所述任務,而所述專用組件是為了執行所述任務而被制造 的。一般來說,在本發明的范圍內可以改變所公開的過程的各步驟的順 序。
在下面連同附圖一起提供對本發明的一個或多個實施例的詳細描 述,所述附圖示出本發明的原理。下面將結合所述實施例來描述本發明, 但是本發明不限于任何實施例。本發明的范圍僅僅由權利要求書來限 定,并且本發明包含許多替換方案、修改和等效方案。為了提供對于本 發明的透徹理解,在下面的描述中闡述了許多具體細節。提供這些細節 是出于舉例的目的,并且可以在沒有一些或全部所述具體細節的情況下 根據權利要求書來實踐本發明。為了清楚起見沒有描述本發明的相關技 術領域內已知的技術材料,以免不必要地模糊本發明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于數據域公司,未經數據域公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200780021765.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:液晶顯示裝置及其驅動電路和驅動方法
- 下一篇:用于控制近視發展的裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





