[發(fā)明專利]一種對文件進(jìn)行編號的同步備份方法在審
| 申請?zhí)枺?/td> | 202010816780.2 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN112115110A | 公開(公告)日: | 2020-12-22 |
| 發(fā)明(設(shè)計)人: | 燕雪峰;丁葉 | 申請(專利權(quán))人: | 南京航空航天大學(xué) |
| 主分類號: | G06F16/178 | 分類號: | G06F16/178;G06F16/182;G06F16/16;G06F11/14 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 曹坤 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文件 進(jìn)行 編號 同步 備份 方法 | ||
本發(fā)明公開了一種對文件進(jìn)行編號的同步備份方法。涉及數(shù)據(jù)存儲和備份技術(shù)領(lǐng)域,包括服務(wù)器端和客戶端,其步驟:1、通過服務(wù)器端讀取源文件夾路徑,分層構(gòu)建源文件目錄編號表;2、將目錄編號表傳輸?shù)娇蛻舳诉M(jìn)行編號的對比;3、客戶端首先讀取待對比文件夾,再從目錄編號表中讀取對應(yīng)層的目錄編號并進(jìn)行對比編號;4、同步變化數(shù)據(jù)。本發(fā)明通過兩輪對比更新目錄編號表,從而分離出使用RSYNC進(jìn)行評估的文件,以降低同步的資源消耗。本發(fā)明提出對文件進(jìn)行編號的方法作為同步過程中的一個中間軟件有效地解決了RSYNC評估開銷過大問題,大大降低了在有限文件發(fā)生改變情況下的同步時間以及資源消耗。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)存儲和備份技術(shù)領(lǐng)域,具體涉及一種對文件進(jìn)行編號的同步備份方法。
背景技術(shù)
隨著信息安全產(chǎn)業(yè)的快速發(fā)展,數(shù)據(jù)安全成為了一個重要課題。解決數(shù)據(jù)安全的通常有以下幾種方法:1、定期磁帶備份:包括遠(yuǎn)程磁帶庫、光盤庫備份和遠(yuǎn)程關(guān)鍵數(shù)據(jù)+磁帶備份;2、數(shù)據(jù)庫備份:就是在與主數(shù)據(jù)庫所在生產(chǎn)機(jī)相分離的備份機(jī)上建立主數(shù)據(jù)庫的一個拷貝;3、網(wǎng)絡(luò)數(shù)據(jù):這種方式是對生產(chǎn)系統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)和所需跟蹤的重要目標(biāo)文件的更新進(jìn)行監(jiān)控與跟蹤,并將更新日志實(shí)時通過網(wǎng)絡(luò)傳送到備份系統(tǒng),備份系統(tǒng)則根據(jù)日志對磁盤進(jìn)行更新;4、遠(yuǎn)程備份:通過高速光纖通道線路和磁盤控制技術(shù)將鏡像磁盤遠(yuǎn)程到其他地方,鏡像磁盤數(shù)據(jù)與主磁盤數(shù)據(jù)完全一致,更新方式為同步或異步。
上述技術(shù)可以在數(shù)據(jù)出現(xiàn)丟失時進(jìn)行單點(diǎn)恢復(fù),但是不具備災(zāi)備能力。所謂災(zāi)備就是將生產(chǎn)數(shù)據(jù)副本保存到異地服務(wù)器中,做數(shù)據(jù)的遠(yuǎn)程備份,保持副本的異地性。常使用的備份方法是Rsync,它通過計算本機(jī)文件中數(shù)據(jù)塊的強(qiáng)弱校驗碼與遠(yuǎn)程數(shù)據(jù)進(jìn)行比對,傳輸兩者不同的部分,這種方法只同步增量部分,提高了同步效率。但是存在兩種極端情況:一、當(dāng)文件數(shù)據(jù)相似程度很高時,Rsync算法為了判斷文件的相同性,會進(jìn)行無用的校驗值計算以及哈希表查找匹配等操作將會耗費(fèi)大量的計算資源以及時間,降低了同步效率;二、當(dāng)文件數(shù)據(jù)相似度很低時,比如新增數(shù)據(jù),Rsync仍將對每個文件進(jìn)行分塊、校驗值計算、哈希表匹配等操作,但是未找到相同數(shù)據(jù)塊,還是將每個數(shù)據(jù)塊都傳輸,這樣就浪費(fèi)了大量比對時間,影響同步速度。所以在進(jìn)行Rsync同步之前,對文件數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)建備份數(shù)據(jù)的目錄編號表將文件數(shù)據(jù)分為變化數(shù)據(jù)以及未變數(shù)據(jù),便可有效的解決上述問題。
發(fā)明內(nèi)容
遠(yuǎn)程同步使用的RSYNC算法是對每個文件數(shù)據(jù)進(jìn)行分塊比較從而得到變化數(shù)據(jù),在文件數(shù)據(jù)相似度很高或者很低的極端情況下,將會耗費(fèi)大量無用的對比時間,針對上述問題,本發(fā)明提供了一種對文件進(jìn)行編號的同步備份方法;此算法作為同步過程中的中間件,分離出RSYNC評估的文件,達(dá)到資源消耗低、時間消耗短的目標(biāo)。
本發(fā)明的技術(shù)方案是:一種對文件進(jìn)行編號的同步備份方法,包括通過無線相連的服務(wù)器端和客戶端;具體包括以下步驟:
一、服務(wù)器端:
步驟(1.1)、通過服務(wù)器端讀取源文件夾路徑,分層構(gòu)建源文件目錄編號表;
步驟(1.2)、將目錄編號表傳輸?shù)娇蛻舳诉M(jìn)行編號的對比;
二、客戶端:
步驟(1.3)、客戶端首先讀取待對比文件夾,再從目錄編號表中讀取對應(yīng)層的目錄編號并進(jìn)行對比編號;
步驟(1.4)、同步變化數(shù)據(jù)。
進(jìn)一步的,在所述步驟(1.1)中,分層構(gòu)建源文件目錄編號表的具體操作步驟如下:
(1.1.1)、讀取根目錄,根據(jù)編號公式對根目錄編號并寫入目錄編號表;
(1.1.2)、獲取子目錄,根據(jù)編號公式對子目錄編號并寫入目錄編號表;
其通用公式如下:
C[i]=N[0]-N[1]-…-N[n].F*(Identifier):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京航空航天大學(xué),未經(jīng)南京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010816780.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





