[發明專利]用于鍵值對文本的壓縮、解壓縮方法、系統及作業機械在審
| 申請號: | 202110209481.7 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN112818081A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 董勝偉;周慶亮;盧向前 | 申請(專利權)人: | 三一重工股份有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F40/242 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 鄭朝然 |
| 地址: | 102206 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 鍵值 文本 壓縮 解壓縮 方法 系統 作業 機械 | ||
本發明提供一種用于鍵值對文本的壓縮、解壓縮方法、系統及作業機械,該壓縮方法包括:獲取目標鍵值對文本中的鍵;根據預設詞典,將所述鍵轉換為替換字符,獲取壓縮文本,其中,所述預設詞典中包括所述鍵、與所述鍵對應的替換字符,所述替換字符的長度小于所述鍵的長度,不同的鍵對應的替換字符不同。該方法針對鍵值對文本,利用更精簡的替換字符代替較復雜的鍵,實現了對鍵值對文本的壓縮,壓縮后可以減小磁盤的空間占用率,并且還能保留鍵值對關系,使得壓縮文本具備一定的可讀性。
技術領域
本發明涉及計算機技術領域,尤其涉及一種用于鍵值對文本的壓縮、解壓縮方法、系統及作業機械。
背景技術
在挖掘機工況數據傳輸時,由于數據量巨大,占用大量帶寬,且容易出現因帶寬不足而導致數據傳輸停滯;而在工況數據存儲時,也出現了磁盤和內存占用較為嚴重的問題,為了節省帶寬、磁盤和內存占用,需要對數據進行壓縮。
通常數據進行壓縮后,就沒有了可讀性,若要使用數據就需要對其進行解壓縮,高可讀性與低空間占用率不能同時兼得,對數據的使用帶來不便。
鍵值對是目前較為流行的數據格式,典型的有JSON(JavaScript ObjectNotation)數據格式及BSON(Binary Serialized Document Format)數據格式等,一個鍵值對中包括鍵和與鍵對應的值,例如“animal”為鍵,其對應的值為“cat”,“animal”和“cat”組成一個鍵值對,以鍵值對的形式存儲數據的優勢在于易讀性,但也存在一定的不足,即占用磁盤空間較多。鍵值對文本是指該文本中的數據是以鍵值對格式進行存儲的。
現有文本壓縮方法一般會是將文本全文壓縮,雖然壓縮率非常高,但可讀性不復存在。如果這類方法用于鍵值對文本,則壓縮后的文本中找不到鍵值對關系。
因此,傳統文本壓縮方法無法應用在鍵值對文本上。
發明內容
本發明提供一種用于鍵值對文本的壓縮、解壓縮方法、系統及作業機械,用以解決現有技術中傳統壓縮方法對鍵值對文本壓縮后找不到鍵值對關系的缺陷,在保留鍵值對關系的基礎上實現鍵值對文本的壓縮。
本發明提供一種用于鍵值對文本的壓縮方法,包括:
獲取目標鍵值對文本中的鍵;
根據預設詞典,將所述鍵轉換為替換字符,獲取壓縮文本,其中,所述預設詞典中包括所述鍵、與所述鍵對應的替換字符,所述替換字符的長度小于所述鍵的長度,不同的鍵對應的替換字符不同。
根據本發明提供的一種用于鍵值對文本的壓縮方法,所述預設詞典通過如下方式獲得:
基于英文字母和/或數字,以長度最短為原則,獲取所述鍵對應的替換字符。
根據本發明提供的一種用于鍵值對文本的壓縮方法,所述基于英文字母和/或數字,以長度最短為原則,獲取所述鍵對應的替換字符,包括:
按照英文字母、數字及兩者結合,獲取所述替換字符;
按照所述替換字符長度由小到大的順序,依次分配給所述鍵。
本發明提供一種用于鍵值對文本的解壓縮方法,包括:
獲取壓縮文本;
根據預設詞典,將所述壓縮文本中的替換字符轉換為鍵,獲取目標鍵值文本,其中,所述預設詞典中包括所述鍵、與所述鍵對應的替換字符,所述替換字符的長度小于所述鍵的長度,不同的鍵對應的替換字符不同。
根據本發明提供的一種用于鍵值對文本的解壓縮方法,所述預設詞典通過如下方式獲得:
基于英文字母和/或數字,以長度最短為原則,獲取所述鍵對應的替換字符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三一重工股份有限公司,未經三一重工股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110209481.7/2.html,轉載請聲明來源鉆瓜專利網。





