[發明專利]用于幫助重復數據刪除產品測試的方法及其裝置有效
| 申請號: | 201010267329.6 | 申請日: | 2010-08-27 |
| 公開(公告)號: | CN102004690A | 公開(公告)日: | 2011-04-06 |
| 發明(設計)人: | 布魯斯·麥克納特 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 邸萬奎 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 幫助 重復 數據 刪除 產品 測試 方法 及其 裝置 | ||
技術領域
本發明一般涉及計算機,更具體地涉及用于在計算存儲環境中產生用于重復數據刪除(deduplication)測試的真實文件內容改變的設備、方法和計算機程序產品裝置。
背景技術
當今社會的各種場合中都有計算機和計算機系統。可以在家、工作單位、學校、政府以及其他場合發現計算環境和網絡。計算環境越來越多地將數據存儲在與呈現給用戶的本地界面分離的一個或多個存儲環境中。在許多情況中,跨越廣域網(WAN)部署存儲環境,其中,向遠離主機的存儲系統發送數據和/或從其中接收數據。
在某些情形中,數據存儲既被本地提供也被提供到遠程存儲環境,以通過提供冗余而增強數據安全性。在這些情形中,可以在多個地點存儲數據的若干個實例。雖然此方案在—個地點處數據丟失的情況下提供了故障保護(failsafe)的恢復,但大量冗余副本的維護耗費資源,諸如耗費網絡帶寬。
為了解決此問題,重復數據刪除機制正被更高頻率地實施。重復數據刪除是指冗余數據的消除。在重復數據刪除處理中,刪除重復數據,僅留下要被存儲的數據的一個副本。然而,若該數據被需要,仍然保留所有數據的索引。因為僅存儲唯一的數據,所以重復數據刪除機制降低了所需要的存儲容量。
發明內容
計算機部件、軟件和硬件需要測試來證實和/或驗證性能。因此,測試重復數據刪除機制來判定通過這些重復數據刪除機制處理的文件是否呈現各種重復數據刪除要素,諸如特定的重復數據刪除比例。這是為了展示來源于將重復數據刪除技術合并到現有存儲機制(諸如備份處理)中的性能和存儲需求上的改進所需要的。
一個當前的驗證機制利用修改指定比例的一組文件內容的測試工具。然而,此機制的缺點在于重復數據刪除的性能和有效性取決于可以被辨識的數據內的重復數據刪除字段的最小大小。為了確保測試將對于重復數據刪除算法和最小字段大小的特定選擇反映可靠的結果,必須控制已修改的和未修改的字段大小的分布。對測試文件的一定大小和內容的需要可以負面地影響后續重復數據刪除測試的精度。
由于前面所述,存在對在很多種真實文件內容改變(包括文件大小和內容)上幫助重復數據刪除測試的機制的需要。因此,提供了用于在計算環境中通過產生實際文件內容改變來幫助重復數據刪除產品測試的各種方法、系統以及計算機程序產品實施例。在一個實施例中,僅僅通過示例提供了用于在計算環境中通過與存儲器裝置通信的處理器來幫助重復數據刪除產品測試的方法。要通過重復數據刪除產品測試被處理的數據被排列到單個連續流中。在呈現尺寸恒定性(scale?invariance)的自相似(self-similar)模式中對排列數據施加多個隨機修改中的至少一個。將在自相似模式中修改的排列數據的多個隨機大小的子集映射到多個隨機大小的重復數據刪除測試文件的每個中。
除了前面的示例實施例外,還提供了各種其它系統、計算機程序產品以及制造方法的實施例,并且提供了相關優點。
附圖說明
為了使本發明的優點易于理解,將參照通過在附圖中示出的具體實施例呈現上文概述的本發明的更具體的描述。可以理解這些附圖描述本發明的實施例,并不因此被認為是其范圍的限制,將通過使用附圖以額外的特征和細節描述和解釋本發明,其中:
圖1是圖示示例性數據重復數據刪除處理的方框圖;
圖2是圖示示例性重復數據刪除產品的方框圖;
圖3是圖示本發明的各方面可以在其中實施的示例性計算環境的方框圖;以及
圖4是用于幫助重復數據刪除產品測試的示例性方法的流程圖,可以在該方法中實施本發明的各方面。
具體實施方式
下面闡述的實施例提供了用于在計算環境中幫助重復數據刪除產品測試的機制。這些機制通過產生多種呈現真實文件內容改變的重復數據刪除測試文件來幫助這種重復數據刪除產品測試。當通過特定重復數據刪除產品的測試來處理這些重復數據刪除測試文件時,如果對生產數據(production?data)應用重復數據刪除產品(包括特定重復數據刪除算法),觀察到可以被推斷到可以發生的影響的特征。結果,所闡述的實施例使得目標重復數據刪除產品測試能使用多種具有變化的大小和文件內容的文件,非常類似在生產數據的重復數據刪除中發生的情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010267329.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:滅火系統及緊急通報系統
- 下一篇:具備水密功能的清洗馬達泵
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





