[發(fā)明專利]一種保證數(shù)據(jù)庫一致性的CDP備份與恢復方法在審
| 申請?zhí)枺?/td> | 201711416866.0 | 申請日: | 2017-12-25 |
| 公開(公告)號: | CN108170766A | 公開(公告)日: | 2018-06-15 |
| 發(fā)明(設計)人: | 施文均;張有成 | 申請(專利權)人: | 南京壹進制信息技術股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F11/14 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 210014 江蘇省南京市白下*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 初始備份 過濾驅動 數(shù)據(jù)庫文件 備份存儲 記錄集 數(shù)據(jù)庫 恢復 捕獲 備份 記錄 讀取 恢復文件 完全備份 準確率 配置 寫入 保證 分析 | ||
本發(fā)明公開了一種保證數(shù)據(jù)庫一致性的CDP備份和恢復方法,備份時,配置IO過濾驅動,配置需要捕獲的文件列表,將數(shù)據(jù)庫文件添加到文件列表中;IO過濾驅動根據(jù)文件列表捕獲數(shù)據(jù)庫文件產生的IO記錄并且分析IO記錄是否具有一致性,生成IO記錄集,將IO記錄集存入備份存儲中;將數(shù)據(jù)庫文件做完全備份,完成CDP的初始備份;初始備份結束后,將備份集寫入備份存儲中;恢復時,IO過濾驅動停止對IO記錄的捕獲;停止數(shù)據(jù)庫的運行;恢復初始備份集,從備份存儲中讀取初始備份集,并進行恢復;使用IO記錄集恢復文件;重新啟動數(shù)據(jù)庫、IO過濾驅動,恢復完成。本發(fā)明在性能上、準確率上、有效性上都有顯著的提高。
技術領域
本發(fā)明涉及數(shù)據(jù)備份和恢復技術領域,具體涉及一種保證數(shù)據(jù)庫一致性的CDP備份與恢復方法。
背景技術
CDP(continual data protection連續(xù)性數(shù)據(jù)保護)是一套方法,它可以捕獲或跟蹤數(shù)據(jù)的變化,并將其獨立存放在生產數(shù)據(jù)之外,以確保數(shù)據(jù)可以恢復到過去的任意時間點。持續(xù)數(shù)據(jù)保護系統(tǒng)可以基于塊、文件或應用實現(xiàn),可以為恢復對象提供足夠細的恢復粒度,實現(xiàn)幾乎無限多的恢復時間點。
CDP產品主要包括基于文件級CDP備份、基于應用級CDP備份。
IO復制技術被業(yè)界廣泛用于CDP產品開發(fā),在一定程度上促進了CDP行業(yè)的發(fā)展;IO復制技術主要包括文件(系統(tǒng))IO和磁盤卷IO;基于IO級復制的CDP產品能夠應用在多種IT環(huán)境中,在一定程度上具有良好的適應性;但在應對數(shù)據(jù)庫應用方面卻存在不足,特別是數(shù)據(jù)的一致性,一直是困擾業(yè)界的技術難題。
數(shù)據(jù)庫的最小存儲單元一般稱為數(shù)據(jù)塊,基本都是固定大小,例如oracle的數(shù)據(jù)塊大小默認是8k。在絕大多數(shù)情況下,每條IO記錄都會包含完整結構的數(shù)據(jù)塊,恢復后的數(shù)據(jù)庫基本上滿足了數(shù)據(jù)一致性;但這是弱一致性,只滿足了數(shù)據(jù)塊級的一致性,而數(shù)據(jù)庫事務對象的邏輯結構一致性并沒有達到。
更多的時候,CDP開發(fā)者并不關心一個或多個IO記錄對應的事務行為,以及是否包含有效數(shù)據(jù),這種邏輯一致性的檢測往往被忽視了;這就是為什么還原之后的數(shù)據(jù)庫雖然正常啟動了,但在運行中卻出現(xiàn)了其他的問題,例如:數(shù)據(jù)對象損壞、無法插入數(shù)據(jù)、實例無法啟動、部分數(shù)據(jù)丟失等。
基于IO復制的CDP產品大都采用了IO過濾驅動技術,IO過濾驅動技術要求開發(fā)專門的IO過濾驅動程序,安裝在操作系統(tǒng)上用來捕獲并復制應用的IO記錄;隨著數(shù)據(jù)庫的事務運行,IO記錄不斷產生,利用這些IO記錄可以將數(shù)據(jù)庫恢復到任意一個IO時間點狀態(tài)。雖然達到了減少RPO(恢復點目標)的效果,可在某些情況下會引起數(shù)據(jù)庫內部的問題,例如導致數(shù)據(jù)庫打不開。一般可以嘗試用其它IO記錄恢復,但這無疑增加了恢復窗口,而且由于不了解有效事務數(shù)據(jù)的一致性時間點,而隨意使用了任意時間還原IO記錄,容易引起數(shù)據(jù)對象的邏輯組織不完整,導致對象無法使用;這種情況就是沒有考慮數(shù)據(jù)庫邏輯一致性問題。
數(shù)據(jù)庫的事務行為會產生IO記錄,作為事務行為的物理存在形式。每個IO記錄由一個或多個數(shù)據(jù)塊構成,IO記錄數(shù)據(jù)長度是數(shù)據(jù)塊大小的整數(shù)倍,可以方便地進行切分,有利于分析。
數(shù)據(jù)庫的物理存儲結構往往比較復雜,例如Oracle包括數(shù)據(jù)文件、控制文件、日志文件等,每種類型文件的數(shù)據(jù)塊結構都不同;如果對這些文件的IO記錄全部分析,那將是一項艱巨而復雜的工作。數(shù)據(jù)庫事務行為一般都記錄在事務日志里面,例如Oracle的redolog、MySQL的binlog等;事務日志文件中的每條記錄表示一個事務行為,包括DML、DDL、DCL等操作。日志記錄存在于一個或多個連續(xù)的數(shù)據(jù)塊中,如附圖1所示,事務日志文件由4個數(shù)據(jù)塊構成,包含5個記錄。事務日志的一致性決定了數(shù)據(jù)庫整體的一致性,所以分析事務日志文件的IO記錄。目前業(yè)界已經(jīng)開放了多種數(shù)據(jù)庫的事務日志的內部結構資料,大致來自技術論壇、數(shù)據(jù)庫廠商、開源項目。利用分析事務日志的IO記錄來確定數(shù)據(jù)庫一致性狀態(tài),這是完全可行性的。
發(fā)明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京壹進制信息技術股份有限公司,未經(jīng)南京壹進制信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711416866.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 計算環(huán)境中按優(yōu)先順序排列要備份的數(shù)據(jù)項的方法和系統(tǒng)
- 虛擬機備份方法、設備及系統(tǒng)
- 用于融合、存儲和檢索增量式備份數(shù)據(jù)的方法和系統(tǒng)
- 一種文件自動備份及還原方法及其系統(tǒng)
- 一種保證數(shù)據(jù)庫一致性的CDP備份與恢復方法
- 一種查詢計劃的獲取方法、數(shù)據(jù)查詢方法及裝置
- 無本地緩存的數(shù)據(jù)備份方法和系統(tǒng)
- 一種起到自動篩選和備份功能的數(shù)據(jù)部署系統(tǒng)
- 一種節(jié)點初始化方法、裝置、設備及存儲介質
- 一種InfluxDB數(shù)據(jù)備份方法、系統(tǒng)及終端設備
- 移動通信系統(tǒng)中前后臺數(shù)據(jù)一致性比較的方法及系統(tǒng)
- 內存數(shù)據(jù)庫文件的更新方法及更新裝置
- 一種機頂盒數(shù)據(jù)庫的實現(xiàn)方法及機頂盒
- 自動化系統(tǒng)數(shù)據(jù)庫文件有效性驗證的方法、裝置及系統(tǒng)
- 一種數(shù)據(jù)庫管理方法、裝置及電子設備
- 一種網(wǎng)絡設備中地址數(shù)據(jù)庫的維護升級方法以及裝置
- 一種數(shù)據(jù)存儲方法、裝置及電子設備
- 離線數(shù)據(jù)處理方法及離線數(shù)據(jù)更新裝置
- 一種數(shù)據(jù)庫文件的導入方法及裝置
- 一種規(guī)范檢測方法及裝置





