[發明專利]一種數據差異比較方法在審
| 申請號: | 201910135895.2 | 申請日: | 2019-02-18 |
| 公開(公告)號: | CN109885421A | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 李晨;葉靜萍 | 申請(專利權)人: | 安徽典典科技發展有限責任公司 |
| 主分類號: | G06F11/10 | 分類號: | G06F11/10;G06F12/06 |
| 代理公司: | 北京聯瑞聯豐知識產權代理事務所(普通合伙) 11411 | 代理人: | 蘇友娟 |
| 地址: | 230000 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標數據塊 校驗和 差異數據 目標文件 數據差異 源數據塊 生成源 數據塊編碼 地址數據 計算目標 目標數據 算法要求 交集 校驗 獲取源 源文件 傳輸 返回 合并 | ||
本發明提供了一種數據差異比較方法,包括以下步驟,生成目標數據塊編碼;計算目標校驗和;合并生成目標文件序列列表;將所述目標文件序列列表傳輸至所述源文件;生成源數據塊編碼;獲取源校驗和;獲取所述目標數據塊編碼和所述目標校驗和;將目標數據塊編碼和所述目標校驗和同源數據塊編碼和所述源校驗和交集比較,生成差異數據地址數據列表;同時比較下一組所述源數據塊與所述目標數據塊;生成源數據與目標數據的差異數據,將所述差異數據返回給目標文件。本發明提供一種滿足算法要求的數據差異比較方法。
技術領域
本發明涉及計算機數據傳輸領域,尤其涉及一種數據差異比較方法。
背景技術
同一數據多處存放、多次存儲的情況經常發生,比如:數據的備份、資料的歸檔,甚至是不當的使用習慣,都會在有意或無意間生成原有數據的一個或多個副本,當相同數據的占用量越來越大時,勢必會造成存儲空間的短缺、查找過程的繁瑣。
傳統意義上,在不同數據之間查詢比較的方式方法多種多樣,數據量不大時,簡單的人工篩選就可能解決問題,無論人工方法或者借助于專門的工具,在比較的過程中都會使用這樣那樣的比對規則,或稱之為差異算法。
簡單的差異算法,像,手工的名稱比對、大小判斷、時間比較、實際內容比較等方式在二個或少量的比較對象之間操作,方便有效。使用適當的比較規則,再加上特定的差異算法或工具,來批量地處理大數據集之間的差異關系,是當前企事單位中較為迫切的需求。
一般情況下,排除軟硬件上的限制因素和算法規模(需要解決的問題的大小)外,判斷一種算法的優劣可能有二種方式:
(1)時間:即完成此算法使用的執行時間,可能是算法執行所使用的總時間,也或是單次執行某個特定步驟所返回的時間;
(2)空間:完成算法執行所需的存儲空間數量大小;此處的空間多指內存空間大小,比如:編譯指令所使用的內存數量,調用函數或中間庫時使用的堆棧數量,存儲常量、變量或中間結果的內存使用量等;
理論上,較為合適的算法規則可能會同時兼顧時間和空間,但隨著硬件設備的發展,空間因素影響的比例在逐漸減低,很多情況下,用空間(增加存儲容量)換取時間的做法也越來越廣泛。比如,常見數組排序中的冒泡算法,通過增加中間變量(會導致內存占用量提高),用空間換時間,執行速度加快;而通過異或運算不使用中間變量的情況下,執行時間會延長。
但是一般的算法中對于算法數據的比較不合理,無法滿足數據傳輸要求。
發明內容
有鑒于此,本發明要為了解決現有技術中算法的數據的比較不合理的問題,從而提供一種數據差異比較方法。
本發明的技術方案是這樣實現的:
一種數據差異比較方法,包括源文件、目標文件和系統組件,包括以下步驟:
(1)將目標文件分隔成多個字節的數據塊,生成目標數據塊編碼;
(2)所述系統組件為所述目標數據塊編碼中的每個所述數據塊計算出十六進制的目標校驗和;
(3)所述系統組件將所述目標數據塊編碼和所述目標校驗和合并形成十六進制的目標文件序列列表;
(4)將所述目標文件序列列表傳輸至所述源文件;
(5)所述系統組件將所述源文件按照所述目標文件的字節個數,生成源數據塊編碼;
(6)所述系統組件為所述源數據塊編碼中的每個數據塊計算十六進制的源校驗和;
(7)從所述目標文件序列列表中,按照順序獲取目標數據塊的每個所述目標數據塊編碼和所述目標校驗和;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽典典科技發展有限責任公司,未經安徽典典科技發展有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910135895.2/2.html,轉載請聲明來源鉆瓜專利網。





