[發明專利]基于去重復存儲系統中用于可擴展引用管理的系統和方法有效
| 申請號: | 201610032143.X | 申請日: | 2011-08-31 |
| 公開(公告)號: | CN105718548B | 公開(公告)日: | 2019-04-26 |
| 發明(設計)人: | F·郭 | 申請(專利權)人: | 賽門鐵克公司 |
| 主分類號: | G06F16/174 | 分類號: | G06F16/174 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 周亞榮;安翔 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 重復 存儲系統 用于 擴展 引用 管理 系統 方法 | ||
本發明涉及基于去重復的存儲系統中用于可擴展引用管理的系統和方法。一個存儲裝置被配置成在多個存儲容器中存儲多個存儲對象,所述存儲容器的每一個被配置成存儲多個所述存儲對象。維護一個存儲容器引用列表,其中對于該多個存儲容器的每一個,該存儲容器引用列表識別多個文件中的哪些文件引用了一個給定存儲容器內的一個存儲對象。響應于檢測到一個給定文件的刪除,該文件引用該多個存儲容器的一個特定存儲容器內的一個對象,一個服務器被配置成通過從該存儲容器引用列表中移除該給定文件的一個識別來更新該存儲容器引用列表。將段對象與引用這些段對象的文件相關聯的一個引用列表可以不響應于該刪除而進行更新。
本申請屬于申請日為2011年8月31日的中國發明專利申請201180050077.4的分案申請。
技術領域
本發明總體上涉及備份存儲系統,尤其是涉及用于協助基于去重復的存儲系統中的資源回收的引用列表。
背景技術
各種組織機構正在積累并存儲大量電子數據。因此,備份存儲系統正在增加尺寸并消耗大量資源。為了應對數量不斷增加的數據的存儲,去重復技術已經成為在備份存儲系統中使存儲利用率最大化的一個重要特征。在典型的去重復系統中,將文件分塊為數據段并且將冗余數據段從系統中刪除。然后,在備份存儲介質中將唯一的數據段存儲為段對象。隨著所存儲的段對象數量的增加,段對象的管理要求提高系統資源的共享,這可能影響去重復系統的整體效率和性能。
基于去重復系統的目的是減少需要存儲大量數據的大量存儲容量。去重復技術已經成熟到它們可以在數量上實現所存儲數據的顯著減少。然而,盡管這些技術可以減少所需要的存儲空間,但系統中存儲的段對象的數量仍然繼續增加。當去重復系統按比例增加以處理更多的數據負載時,段對象的管理和標引就成為影響系統性能的重要因素。
典型地,段對象尺寸小,在一些系統中僅有4千字節(KB)。對于存儲400兆兆字節(TB)數據的系統(所有段對象大小為4KB),要維護1000億個段對象。隨著存儲需求的增長,段對象數量上的增加可能產生無法接受的管理開銷。因此,需要高可擴展性管理系統來有效地存儲和管理大量段對象。
特別具有挑戰性的問題包括在從系統刪除文件后恢復資源。當刪除一個文件時,不能簡單地刪除組成該文件的段對象,因為系統所存儲的一些其他文件有可能引用了那些相同段對象的一個或多個。只要沒有其他文件使用那些段對象,就可以將它們刪除。某種管理形式需要持續跟蹤段對象以及使用這些段對象的所有文件。存在用于管理段對象以及指向它們的文件的各種技術,當小規模操作時這些技術中的大部分可以工作良好。然而,在應對大量段對象時這些方法中的很多可能不會有效。
協助資源回收的一個技術是對段對象進行引用計數。引用數存儲了一個值,該值表示有多少文件指向或使用該段。每當一個文件使用段對象時它的引用數就遞增,并且當刪除使用該段的文件時遞減,最終當該數降為零時可以回收該段。
引用計數具有不適合于去重復的一些限制。一個限制是任何丟失或重復更新會不適當地改變該計數。如果該數偶然減少,當段仍由至少一個文件使用時可能被刪除。如果該數偶然增加,那么甚至在使用該段的所有文件都從系統中刪除后可能永遠不會刪除該段。
引用計數的另一個缺點是它不允許識別哪些文件使用一個給定段對象。如果段對象遭到破壞,備份系統需要知道哪些文件正在使用它,這樣可以要求該文件恢復破壞的數據。然而,引用計數并不維護哪些文件正使用每個特定段對象的列表,這使得破壞數據的恢復更為困難。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于賽門鐵克公司,未經賽門鐵克公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610032143.X/2.html,轉載請聲明來源鉆瓜專利網。





