[發明專利]一種文件處理方法及裝置在審
| 申請號: | 201810714009.7 | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN109062987A | 公開(公告)日: | 2018-12-21 |
| 發明(設計)人: | 冉世友;陳正;殷舒;劉勝 | 申請(專利權)人: | 聯動優勢科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100082 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 節點數據 目標文件 數據庫 第一位置 文件處理 映射關系 存儲 數據處理技術 節省資源 索引文件 占用 | ||
本發明實施例涉及數據處理技術領域,尤其涉及一種文件處理方法及裝置,用以減少對空間的占用,節省資源。本發明實施例包括:針對目標文件中的第一節點數據,若確定所述第一節點數據的內容與數據庫中存儲的節點數據的內容均不相同,則將所述第一節點數據存儲在所述數據庫中,并確定所述第一節點數據在所述目標文件中的第一位置;所述第一節點數據為所述目標文件中的任一節點數據;形成所述第一位置與所述第一節點數據的內容的映射關系;將所述映射關系加入所述數據庫的索引文件。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種文件處理方法及裝置。
背景技術
隨著信息技術的不斷發展,文件的收發、存儲已成為信息處理中的重要環節。一般,對文件存儲和壓縮的過程中,會出現將多個文件一起存儲或傳輸的情況。在發送文件之前,會對原始文件進行壓縮,得到比原始文件小的壓縮包,對壓縮包進行傳輸。在接收到壓縮包之后,通過對壓縮包進行解壓得到原始文件,這樣可以在文件傳輸過程中減少資源損耗。
在遇到需要處理大量相似文件時,如對于電子合同,通常是將一系列文件直接進行存儲或壓縮,這樣會占用大量的空間,造成資源的浪費。
發明內容
本申請提供一種文件處理方法及裝置,用以減少對空間的占用,節省資源。
本發明實施例提供的一種文件處理方法,包括:
針對目標文件中的第一節點數據,若確定所述第一節點數據的內容與數據庫中存儲的節點數據的內容均不相同,則將所述第一節點數據存儲在所述數據庫中,并確定所述第一節點數據在所述目標文件中的第一位置;所述第一節點數據為所述目標文件中的任一節點數據;
形成所述第一位置與所述第一節點數據的內容的映射關系;
將所述映射關系加入所述數據庫的索引文件。
可選的,還包括:
若確定所述數據庫中存儲的第二節點數據的內容與所述第一節點數據的內容相同,則形成所述第一位置與所述第二節點數據的內容的映射關系;
將所述映射關系加入所述數據庫的索引文件。
可選的,所述索引文件的映射關系還包括節點數據的內容對應的哈希值;
所述若確定所述第一節點數據的內容與數據庫中存儲的節點數據的內容均不相同,則將所述第一節點數據存儲在所述數據庫中,包括:
根據所述第一節點數據的內容確定所述第一節點數據的哈希值;
確定所述數據庫中是否存在與所述第一節點數據的哈希值相同的哈希值;
若不存在,則將所述第一節點數據存儲在所述數據庫中,并將所述第一節點數據的哈希值加入所述索引文件中;
所述形成所述第一位置與所述第一節點數據內容的映射關系,包括:
形成所述第一位置與所述第一節點數據的哈希值之間的映射關系。
可選的,所述目標文件為多個待處理文件中的任一文件,所述多個待處理文件的文件類型相同;
所述數據庫中存儲的節點數據為所述多個待處理文件中任一文件的節點數據。
可選的,所述將所述第一節點數據存儲在所述數據庫中,包括:
將所述第一節點數據的內容進行壓縮后存儲在所述數據庫中;
所述將所述映射關系加入所述數據庫的索引文件之后,還包括:
將所述索引文件進行壓縮并存儲在所述數據庫中。
本發明實施例還提供一種文件處理裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯動優勢科技有限公司,未經聯動優勢科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810714009.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種標簽的分類處理方法及裝置
- 下一篇:街景圖像的更新方法及裝置





