[發明專利]一種在數據存儲前去除重復數據的方法有效
| 申請號: | 201310278342.5 | 申請日: | 2013-07-04 |
| 公開(公告)號: | CN104281412A | 公開(公告)日: | 2015-01-14 |
| 發明(設計)人: | 鄔玉良 | 申請(專利權)人: | 北京中科同向信息技術有限公司 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 存儲 去除 重復 方法 | ||
1.一種在數據存儲前根據待處理數據的組織特征來去除重復數據的方法,其步驟如下:
(1)判斷待處理的數據組織結構是否與已存在的數據一致。
(2)若一致則獲取其結構類型的數據切割器,再將數據從硬盤加載到內存,傳入待處理數據;如不一致,則獲取數據結構的數據切割器,傳入待處理數據。
(3)將待處理數據由切割器分割為子數據塊,并為子數據塊生成唯一的標識符。
(4)提取存儲中數據的標識符、校驗碼并合并。
(5)然后判斷是否存在重復的標識符和校驗碼,并存儲。
2.如權利要求1中所述的在數據存儲前根據待處理數據的組織特征來去除重復數據的方法其目的是在于解決數據存儲前對重復數據的識別、去除問題。
3.如權利要求1中所述的在數據存儲方法其特征是在數據存儲前利用待處理數據的組織特征將其切割為長度不等的子數據塊并對每一子數據塊生成一個標準標識符來識別是否存在重復數據,然后在數據存儲前將數據進行處理,降低存儲后重復數據刪除誤判的可能性。
4.如權利要求1中步驟(1)所述的數據的組織結構含義是:假如數據用D表示,數據間的關系用R表示,則DR=(D,R)就表示數據組織結構。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科同向信息技術有限公司,未經北京中科同向信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310278342.5/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





