[發明專利]數據比對方法和裝置無效
| 申請號: | 201010507030.3 | 申請日: | 2010-09-27 |
| 公開(公告)號: | CN101957858A | 公開(公告)日: | 2011-01-26 |
| 發明(設計)人: | 高水波;華國棟;黎楚兵;史美康 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 余剛;吳孟秋 |
| 地址: | 518057 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 方法 裝置 | ||
技術領域
本發明涉及通信領域,具體而言,涉及一種數據比對方法和裝置。
背景技術
隨著當前通訊業的不斷發展,相關軟件系統也越來越復雜,這些系統一般都包含許多的子系統和外圍系統,為了保證這些系統數據的一致性,經常需要去比較各系統間的同類數據,使其保持一致,以保證整個系統的正常運行。
由于在通訊行業內,比較的這類數據量通常十分龐大,采用一般的文本比較工具來處理很容易出錯,目前業內也有各式各樣的比對方法:
1)采用第三方工具,諸如ue、merge等工具軟件結合使用來比對;
2)在數據庫中通過存儲過程采用游標的方式來比對;
3)采用hash(Hash,一種常用的數據存儲結構,又叫哈希表或散列表)表存儲數據的方式來比對。
上述方法1)用來比較小數據量的文件數據時還可以勝任,但如果用來處理大量數據的時候,往往操作者會顧此失彼,產生很多錯誤,這樣也致使比對的效率十分低下;方法2)所采用的方式是借助數據庫的特性來處理完成比對工作,這不失為一個簡便的處理方式,但是其缺點正是數據庫本身帶來的:對系統軟、硬件環境的依賴性高,處理速度也很慢;方法3)是當前被普遍采用的一種比對方法,相對于前面的兩種方式,其擁有處理效率較高的優勢,但是發明人經過測試發現其在處理海量數據的時候,對計算機的軟、硬件的要求很高,對內存的占用率特別大。
通過上述分析,根據現有技術中的數據比對方法,內存占用率較高,執行時間較長、效率較低。
發明內容
針對現有技術中的數據比對方法導致內存占用率較高的問題而提出本發明,為此,本發明的主要目的在于提供一種數據比對方法和裝置,以解決上述問題至少之一。
為了實現上述目的,根據本發明的一個方面,提供了一種數據比對方法,其包括:將源文件的第一哈希HASH信息與目標文件的第二HASH信息進行比較;根據比較結果生成上述源文件與上述目標文件的比對結果。
進一步地,將源文件的第一哈希HASH信息與目標文件的第二HASH信息進行比較包括:在內存中建立與上述源文件對應的內存索引表,其中,上述內存索引表包括與上述第一哈希HASH信息中的所有HASH值對應的索引記錄;在上述內存索引表中查找是否存在與上述第二HASH信息對應的索引記錄,其中,上述索引記錄中的HASH值等于上述第二HASH信息中的HASH值。
進一步地,在內存中建立與上述源文件對應的內存索引表時,還包括:在上述內存中建立沖突列表,其中,上述沖突列表為連續存儲空間,用于保存在比對上述源文件與上述目標文件時產生的沖突元素。
進一步地,根據比較結果生成上述源文件與上述目標文件的比對結果包括:若在上述內存索引表中查找出存在與上述第二HASH信息對應的索引記錄,則生成第一指示信息,其中,上述第一指示信息用于指示上述源文件與上述目標文件共同具有與查找出的上述索引記錄中的HASH值對應的數據信息;若在上述內存索引表中查找出不存在與上述第二HASH信息對應的索引記錄,則生成第二指示信息,其中,上述第二指示信息用于指示上述源文件中不具有與上述第二HASH信息中的HASH值對應的數據信息。
進一步地,根據比較結果生成上述源文件與上述目標文件的比對結果包括:若在上述內存索引表中查找出存在與上述第二HASH信息對應的索引記錄,則將上述目標文件中與第二HASH信息對應的記錄信息與上述源文件中與上述索引記錄對應的記錄信息進行比較;若兩者相同,則生成第三指示信息,其中,上述第三指示信息用于指示上述源文件與上述目標文件共同具有與查找出的上述索引記錄中的HASH值對應的數據信息;若在上述內存索引表中查找出不存在與上述第二HASH信息對應的索引記錄,則生成第四指示信息,其中,上述第四指示信息用于指示上述源文件中不具有與上述第二HASH信息中的HASH值對應的數據信息。
進一步地,上述源文件與上述目標文件具有相同的文件格式。
為了實現上述目的,根據本發明的另一方面,提供了一種數據比對裝置,其包括:比較單元,用于將源文件的第一哈希HASH信息與目標文件的第二HASH信息進行比較;生成單元,用于根據比較結果生成上述源文件與上述目標文件的比對結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010507030.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





