[發(fā)明專利]一種數(shù)據(jù)壓縮編碼處理的方法和設(shè)備有效
| 申請?zhí)枺?/td> | 202110092257.4 | 申請日: | 2021-01-23 |
| 公開(公告)號: | CN112886967B | 公開(公告)日: | 2023-01-10 |
| 發(fā)明(設(shè)計(jì))人: | 秦臻;王振;徐江波;王金富 | 申請(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | H03M7/30 | 分類號: | H03M7/30 |
| 代理公司: | 北京連和連知識產(chǎn)權(quán)代理有限公司 11278 | 代理人: | 陳黎明;楊帆 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù)壓縮 編碼 處理 方法 設(shè)備 | ||
本發(fā)明提供了一種數(shù)據(jù)壓縮編碼處理的方法和設(shè)備,該方法包括:獲取編碼對應(yīng)的樹形和閾值層數(shù);判斷樹形對應(yīng)的層數(shù)是否超過閾值層數(shù);響應(yīng)于有樹形的層數(shù)超過閾值層數(shù),將超過閾值層數(shù)的樹形與未超過閾值層數(shù)的樹形進(jìn)行剪切與合并后形成新的樹形;將新的樹形轉(zhuǎn)化為新編碼。通過使用本發(fā)明的方案,能夠?qū)舴蚵鼧淙我獬L碼均有良好壓縮效果,為后續(xù)DEFLATE壓縮過程提供有效的保障,具有計(jì)算快捷簡便,效果穩(wěn)定的優(yōu)點(diǎn)。
技術(shù)領(lǐng)域
本領(lǐng)域涉及計(jì)算機(jī)領(lǐng)域,并且更具體地涉及一種數(shù)據(jù)壓縮編碼處理的方法和設(shè)備。
背景技術(shù)
近幾年來,隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)信息呈現(xiàn)出爆炸式的增長。云計(jì)算的興起,人工智能的推進(jìn),大數(shù)據(jù)時(shí)代的到來,新的工作負(fù)載不斷增大,海量數(shù)據(jù)傳輸和存儲的問題不斷引起關(guān)注,如何能夠高效的傳輸海量數(shù)據(jù),同時(shí)不對處理器造成過于沉重負(fù)荷的問題亟待解決。如果能夠在文件傳輸時(shí)進(jìn)行預(yù)先壓縮,不僅可以節(jié)省數(shù)據(jù)流量,同時(shí)也降低了傳輸時(shí)間;如果在讀取磁盤文件之前對文件進(jìn)行壓縮,就可以提高文件讀取的速率;總而言之,壓縮數(shù)據(jù)從一個新的角度提供了改善計(jì)算機(jī)性能的方法,對其的研究具有重要的現(xiàn)實(shí)意義。
廣泛應(yīng)用的有效壓縮算法應(yīng)具備三個重要的特性:通用、無損、高壓縮比。通用是指源數(shù)據(jù)的一般性,很多數(shù)據(jù)由于其本身的編碼方式?jīng)Q定了其特殊性,根據(jù)這些特殊性進(jìn)行有針對性的研究可以大大提高壓縮效果,而這里我們關(guān)注的是適用于非特定數(shù)據(jù)的通用壓縮算法。無損是指數(shù)據(jù)壓縮后的編碼與源碼相比包含的信息量相同。高壓縮比是指壓縮后降低存儲空間比原存儲空間的結(jié)果盡可能大。就現(xiàn)狀而言,具有通用性的無損壓縮因數(shù)據(jù)特征未知且不允許信息丟失,造成壓縮效率難以得到大的提高而發(fā)展緩慢,使得無損壓縮成為必要的研究課題。
霍夫曼編碼是經(jīng)典無損壓縮標(biāo)準(zhǔn)DEFLATE(同時(shí)使用LZ77與霍夫曼Coding的一種無損數(shù)據(jù)壓縮方式)中重要的步驟,其中霍夫曼編碼分為靜態(tài)霍夫曼編碼和動態(tài)霍夫曼編碼,我們這里只對算法較復(fù)雜的動態(tài)霍夫曼編碼的算法作為研究。霍夫曼編碼是對數(shù)據(jù)經(jīng)過LZ77(一種基于字典的、“滑動窗”的無損壓縮算法)壓縮后的二次壓縮,又進(jìn)一步提高了壓縮率,它是通過統(tǒng)計(jì)字符出現(xiàn)次數(shù),對數(shù)據(jù)處理的可變長編碼,利用字符出現(xiàn)的次數(shù),構(gòu)造霍夫曼二叉樹,從樹的葉子節(jié)點(diǎn)到根節(jié)點(diǎn)進(jìn)行編碼,出現(xiàn)的越多的字符讓短一些的碼替換,同時(shí)次數(shù)少的字符被長一些的碼替換掉,可以實(shí)現(xiàn)數(shù)據(jù)的總體大小減小,達(dá)到壓縮的目的。然而,由于數(shù)據(jù)信息的復(fù)雜程度不同或是數(shù)據(jù)塊的長度不同,霍夫曼樹的形狀差異很大。但為了壓縮效果和編碼效率,一般會設(shè)定一個最大碼長,也就是霍夫曼樹最大的深度。在上述霍夫曼樹生成的過程中,無法保證其深度不超過規(guī)定深度。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例的目的在于提出一種數(shù)據(jù)壓縮編碼處理的方法和設(shè)備,通過使用本發(fā)明的技術(shù)方案,能夠?qū)舴蚵鼧淙我獬L碼均有良好壓縮效果,為后續(xù)DEFLATE壓縮過程提供有效的保障,具有計(jì)算快捷簡便,效果穩(wěn)定的優(yōu)點(diǎn)。
基于上述目的,本發(fā)明的實(shí)施例的一個方面提供了一種數(shù)據(jù)壓縮編碼處理的方法,包括以下步驟:
獲取編碼對應(yīng)的樹形和閾值層數(shù);
判斷樹形對應(yīng)的層數(shù)是否超過閾值層數(shù);
響應(yīng)于有樹形的層數(shù)超過閾值層數(shù),將超過閾值層數(shù)的樹形與未超過閾值層數(shù)的樹形進(jìn)行剪切與合并后形成新的樹形;
將新的樹形轉(zhuǎn)化為新編碼。
根據(jù)本發(fā)明的一個實(shí)施例,響應(yīng)于有樹形的層數(shù)超過閾值層數(shù),將超過閾值層數(shù)的樹形與未超過閾值層數(shù)的樹形進(jìn)行剪切與合并后形成新的樹形包括:
判斷閾值層數(shù)的下一層的樹形中是否有葉子節(jié)點(diǎn);
響應(yīng)于閾值層數(shù)的下一層的樹形中有葉子節(jié)點(diǎn),取出葉子節(jié)點(diǎn)和對應(yīng)的父節(jié)點(diǎn);
從距閾值層數(shù)最近的上層的樹形節(jié)點(diǎn)中取出第一葉子節(jié)點(diǎn)并將對應(yīng)的父節(jié)點(diǎn)、葉子節(jié)點(diǎn)和第一葉子節(jié)點(diǎn)組成子樹;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110092257.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H03M 一般編碼、譯碼或代碼轉(zhuǎn)換
H03M7-00 把用給定序列的數(shù)字或給定數(shù)目的數(shù)字來表示信息的碼,轉(zhuǎn)換到用不同序列的數(shù)字或不同數(shù)目的數(shù)字來表示相同信息的碼
H03M7-02 .轉(zhuǎn)換到加權(quán)代碼或相反轉(zhuǎn)換,即對一數(shù)字的加權(quán)與該數(shù)字在信息組或代碼字中的位置有關(guān)
H03M7-14 .轉(zhuǎn)換到非加權(quán)代碼或相反轉(zhuǎn)換
H03M7-26 .轉(zhuǎn)換到隨機(jī)碼或相反轉(zhuǎn)換
H03M7-28 .可編程序結(jié)構(gòu),即代碼轉(zhuǎn)換器所包括的設(shè)備其算符是可變的,以調(diào)整轉(zhuǎn)換程序
H03M7-30 .壓縮
- 基于WLAN網(wǎng)絡(luò)的數(shù)據(jù)壓縮傳輸方法、STA及AP
- 一種數(shù)據(jù)壓縮存儲方法、裝置,及分布式文件系統(tǒng)
- 數(shù)據(jù)傳輸、數(shù)據(jù)接收方法及裝置
- 一種數(shù)據(jù)壓縮存儲方法以及數(shù)據(jù)壓縮存儲裝置
- 數(shù)據(jù)的傳輸方法、數(shù)據(jù)傳輸裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 數(shù)據(jù)壓縮系統(tǒng)、有損數(shù)據(jù)壓縮的方法和數(shù)據(jù)壓縮的方法
- 數(shù)據(jù)壓縮方法、數(shù)據(jù)壓縮系統(tǒng)以及采用該系統(tǒng)的車輛ECU
- 數(shù)據(jù)壓縮方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 口授系統(tǒng)
- 具有幾個數(shù)據(jù)壓縮信道的數(shù)據(jù)壓縮組件





