[發明專利]一種海量文件的快速備份與恢復的方法有效
| 申請號: | 201310688991.2 | 申請日: | 2013-12-17 |
| 公開(公告)號: | CN104714859A | 公開(公告)日: | 2015-06-17 |
| 發明(設計)人: | 俞訓峰;許萍萍 | 申請(專利權)人: | 南京壹進制信息技術有限公司 |
| 主分類號: | G06F11/14 | 分類號: | G06F11/14 |
| 代理公司: | 無 | 代理人: | 無 |
| 地址: | 210014 江蘇省南京市秦淮區光*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 海量 文件 快速 備份 恢復 方法 | ||
技術領域
本發明屬于數據存儲和備份技術領域,具體支持海量文件的快速備份與恢復的方法。
背景技術
在互聯網快速發展與云計算時代到來的背景下,基于以文件為中心的存儲基礎架構而運行的應用(Web服務器、電子郵件、電子記錄、電子檔案、數字媒體)在企業數據中正占據越來越高的比例。IDC認為,全球存儲市場總出貨量80%將用來存儲非結構化數據,即文件數據。隨著這些海量文件數據的增長,其數據備份也成為一個難題。
傳統海量文件備份恢復的方法,首先要進行完整備份,將所有要備份的文件打包到一個壓縮文件中,并保存備份的文件元數據信息(源位置、源文件名、修改時間、源大小)到數據庫或類似數據庫技術的文件中;接著進行增量備份時,將現有文件信息與保存的備份文件元數據信息進行比較,找到已經改變的文件進行打包到壓縮文件中,并再次保留增量文件的元數據信息。在進行恢復時,首先要恢復完整備份,再恢復要恢復時間點之前的所有增量備份,獲得相應時間點的文件。
傳統海量文件備份恢復存在如下問題:
(1)需要備份的文件數量越多,存放備份文件元數據信息的文件過大,如果采用小型數據庫存放元數據,可能效率太低,采用大型數據庫會有版權問題。自行設計結構存放,則備份時需要耗費很大系統資源,并且設計數據結構時容易存在瓶頸。
(2)判斷增量文件時需要結合完整備份與所有增量備份的元數據信息,隨著增量備份的數量增多,越來越慢。
(3)恢復時需要先恢復完整備份,再恢復增量備份,所以恢復到離完整備份近的備份點速度快,恢復到離當前時間近的備份點速度慢。
(4)備份的數據格式不透明,必須通過恢復操作才能使用。
發明內容
本發明的目的在于克服上述現有技術中的不足,提出了支持海量文件的快速備份與恢復的方法。
本發明所涉及的支持海量文件的快速備份與恢復的方法,其主要技術步驟包括:
備份步驟:
(1)先創建一個空的最新備份文件目錄,進行完整備份,完整備份操作過程與一次增量備份操作過程一致。
(2)增量備份時,創建一個空的增量備份時間點目錄,在增量備份時間點目錄存放備份文件元數據信息(源位置、文件名、修改時間、文件大小)列表,此文件僅在恢復時需要讀取。
(3)枚舉要備份的文件,通過對需要備份的文件和最新備份文件目錄中直接定位的備份文件進行對比(修改時間、文件大小),發現文件增加、修改、刪除時進行增量備份操作。在文件元數據信息列表中記錄要備份文件的元數據信息。
(4)增量備份操作過程如下:
文件增加,拷貝到最新備份文件目錄,在最新備份文件目錄中保持文件的目錄結構不變;
文件刪除,移動文件到上一個增量備份時間點目錄,在增量備份時間點目錄中保持文件的目錄結構不變;
文件修改,移動文件到上一個增量備份時間點目錄,拷貝當前文件到最新備份文件目錄,在最新備份文件目錄和增量備份時間點目錄中保持文件的目錄結構不變;
更新當前增量備份時間點目錄中的元數據信息列表,同時記錄已經備份的文件數與文件總數據量;
當備份版本數已經到限制數量時,將最早的增量備份時間點目錄進行刪除。
恢復步驟:
(1)讀取指定增量備份時間點中的文件元數據信息列表;
(2)根據文件元數據信息列表中的文件恢復指定的文件;
(3)先從當前增量備份時間點目錄中找文件,如果找不到,則到后一個增量備份時間點目錄中尋找,最后是最新備份文件目錄。
與現有技術相比,本發明具有以下優點:
1.不在數據庫或類似數據庫技術的文件中記錄備份文件元數據信息,減少系統資源消耗。在可以備份的文件數量上不會存在設計瓶頸。理論上文件系統可以存放多少文件,就可以備份多少文件。
2.隨著增量備份的數量增多,在查找本次備份改變的文件上速度不會變慢。因為每次查找改變的文件都只是需要備份源文件與最新備份文件目錄中的文件之間的比較。
3.通過要恢復的時間點中的元數據信息列表就可以快速找到需要恢復的文件,恢復到最新時間點近的備份點速度快,更加符合實際的使用需求。
4.可以快速的獲取最新備份時間點的數據,對于某些特定應用(如PACS數據服務器、電子檔案服務器),將其數據存儲路徑指定為最新備份文件所在目錄,就可以方便的進行數據恢復驗證或數據臨時接替。
附圖說明
圖1是海量文件備份與恢復的方法結構圖
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京壹進制信息技術有限公司;,未經南京壹進制信息技術有限公司;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310688991.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種表格驅動的單元測試系統和方法
- 下一篇:一種軟件修復方法及終端設備





