[發(fā)明專利]一種基于不定長(zhǎng)標(biāo)識(shí)碼的XML的壓縮方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201310580015.5 | 申請(qǐng)日: | 2013-11-19 |
| 公開(公告)號(hào): | CN103605730A | 公開(公告)日: | 2014-02-26 |
| 發(fā)明(設(shè)計(jì))人: | 龔如賓;張煉珠 | 申請(qǐng)(專利權(quán))人: | 山西三恒自動(dòng)化設(shè)備有限公司;上海理工大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 太原高欣科創(chuàng)專利代理事務(wù)所(普通合伙) 14109 | 代理人: | 冷錦超;鄧東東 |
| 地址: | 030006 山西省太原市*** | 國省代碼: | 山西;14 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 定長(zhǎng) 標(biāo)識(shí) xml 壓縮 方法 裝置 | ||
1.一種基于不定長(zhǎng)標(biāo)識(shí)碼的XML的壓縮方法,其特征在于:該方法包括:
對(duì)于XML文檔中的每一個(gè)元素,在數(shù)據(jù)字典中定義一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼;以及對(duì)于XML文檔中的每一個(gè)屬性,在數(shù)據(jù)字典中定義一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼;
發(fā)送方使用所述數(shù)據(jù)字典中定義的對(duì)應(yīng)不定長(zhǎng)標(biāo)識(shí)碼逐個(gè)替換XML文檔中的元素和屬性,實(shí)現(xiàn)XML文檔的替換壓縮;?
接收方根據(jù)所述數(shù)據(jù)字典中定義的與相應(yīng)不定長(zhǎng)標(biāo)識(shí)碼對(duì)應(yīng)的元素和屬性替換所接收到的替換壓縮后的XML文檔中的不定長(zhǎng)標(biāo)識(shí)碼,實(shí)現(xiàn)XML文檔的解壓;
所述對(duì)于XML文檔中的每一個(gè)元素,在數(shù)據(jù)字典中定義一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼;以及對(duì)于XML文檔中的每一個(gè)屬性,在數(shù)據(jù)字典中定義一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼包括:
對(duì)于XML文檔中的每一個(gè)元素,采用8位比特位標(biāo)識(shí)碼表示,或是采用16位比特位標(biāo)識(shí)碼表示;其中高4位中的第1位用于判斷是否為XML格式,第2位用于判斷是否為元素,第3位用于判斷是否為結(jié)束元素,第4位用于判斷是否需要使用兩個(gè)8位的字節(jié)來表示同一元素,剩余的比特位用于表示該元素;
對(duì)于XML文檔中的每一個(gè)屬性,采用8位比特位標(biāo)識(shí)碼表示,或是采用16位比特位標(biāo)識(shí)碼表示;其中高3位中的第1位用于判斷是否為XML格式,第2位用于判斷是否為屬性,第3位用于判斷是否需要使用兩個(gè)8位的字節(jié)來表示同一屬性,剩余的比特位用于表示該屬性,其中屬性的值以字符串格式表示。
2.根據(jù)權(quán)利要求1所述的一種基于不定長(zhǎng)標(biāo)識(shí)碼的XML的壓縮方法,其特征在于:在所述數(shù)據(jù)字典中,對(duì)于XML文檔中的每一個(gè)元素,采用頻度分析法來決定采用8位比特位標(biāo)識(shí)碼表示,或是采用16位比特位標(biāo)識(shí)碼表示。
3.根據(jù)權(quán)利要求1所述的一種基于不定長(zhǎng)標(biāo)識(shí)碼的XML的壓縮方法,其特征在于:在所述數(shù)據(jù)字典中,對(duì)于XML文檔中的每一個(gè)元素,采用耗費(fèi)字節(jié)數(shù)分析法來決定采用8位比特位標(biāo)識(shí)碼表示,或是采用16位比特位標(biāo)識(shí)碼表示。
4.根據(jù)權(quán)利要求1所述的一種基于不定長(zhǎng)標(biāo)識(shí)碼的XML的壓縮方法,其特征在于:在所述數(shù)據(jù)字典中,對(duì)于XML文檔中的每一個(gè)屬性,采用頻度分析法來決定采用8位比特位標(biāo)識(shí)碼表示,或是采用16位比特位標(biāo)識(shí)碼表示。
5.根據(jù)權(quán)利要求1所述的一種基于不定長(zhǎng)標(biāo)識(shí)碼的XML的壓縮方法,其特征在于:在所述數(shù)據(jù)字典中,對(duì)于XML文檔中的每一個(gè)屬性,采用耗費(fèi)字節(jié)數(shù)分析法來決定采用8位比特位標(biāo)識(shí)碼表示,或是采用16位比特位標(biāo)識(shí)碼表示。
6.根據(jù)權(quán)利要求1至5中任一權(quán)利要求所述的一種基于不定長(zhǎng)標(biāo)識(shí)碼的XML的壓縮方法,其特征在于:所述壓縮方法也適用于多個(gè)具有相同DTD或者多個(gè)具有相同XML?SCHMEA的XML文檔的壓縮,其中所述數(shù)據(jù)字典為多個(gè)XML文檔共享的通用數(shù)據(jù)字典。
7.一種XML的壓縮裝置,其特征在于:該裝置包括:XML讀取模塊、壓縮用數(shù)據(jù)字典存儲(chǔ)模塊、標(biāo)簽替換壓縮模塊和通用壓縮模塊;其中:
XML讀取模塊,用于讀取XML字節(jié)流數(shù)據(jù);
壓縮用數(shù)據(jù)字典存儲(chǔ)模塊,用于保存數(shù)據(jù)字典;
在所述數(shù)據(jù)字典中,對(duì)于XML文檔中的每一個(gè)元素,在數(shù)據(jù)字典中定義了一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼;以及對(duì)于XML文檔中的每一個(gè)屬性,在數(shù)據(jù)字典中定義了一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼;
標(biāo)簽替換壓縮模塊,用于根據(jù)數(shù)據(jù)字典存儲(chǔ)模塊中定義的對(duì)應(yīng)不定長(zhǎng)標(biāo)識(shí)碼逐個(gè)替換XML文檔中的元素和屬性,生成替換壓縮后的XML文檔;
通用壓縮模塊,用于對(duì)數(shù)據(jù)字典和替換壓縮后的XML文檔使用通用壓縮算法進(jìn)行進(jìn)一步壓縮,生成壓縮數(shù)據(jù)。
8.一種XML的解壓裝置,其特征在于:該裝置包括:通用解壓模塊、解壓用數(shù)據(jù)字典存儲(chǔ)模塊和標(biāo)簽替換解壓模塊,其中:
通用解壓模塊,用于對(duì)接收到的壓縮數(shù)據(jù)使用通用解壓算法進(jìn)行解壓;
解壓用數(shù)據(jù)字典存儲(chǔ)模塊,用于存儲(chǔ)數(shù)據(jù)字典;
在所述數(shù)據(jù)字典中,對(duì)于XML文檔中的每一個(gè)元素,在數(shù)據(jù)字典中定義了一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼;以及對(duì)于XML文檔中的每一個(gè)屬性,在數(shù)據(jù)字典中定義了一個(gè)與之相對(duì)應(yīng)的不定長(zhǎng)標(biāo)識(shí)碼;
標(biāo)簽替換解壓模塊,使用解壓用數(shù)據(jù)字典存儲(chǔ)模塊存儲(chǔ)的數(shù)據(jù)字典,將替換壓縮后的XML文檔中的不定長(zhǎng)標(biāo)識(shí)碼逐個(gè)反替換為對(duì)應(yīng)的元素和屬性,解壓得到原始的XML文檔。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山西三恒自動(dòng)化設(shè)備有限公司;上海理工大學(xué),未經(jīng)山西三恒自動(dòng)化設(shè)備有限公司;上海理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310580015.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- Java中的XML類型
- 數(shù)據(jù)庫中XML模式的原地演進(jìn)
- 在標(biāo)記語言環(huán)境中使用可撤消命令來編輯文檔的文檔處理和管理方法
- XML文檔管理系統(tǒng)及其方法與XML文檔訪問控制方法
- 用于處理用于在XML數(shù)據(jù)庫中存儲(chǔ)的非XML文檔的方法和系統(tǒng)
- 一種XML元數(shù)據(jù)對(duì)象化解析方法及系統(tǒng)
- 一種XML信息獲取方法和系統(tǒng)
- 將XML文檔自動(dòng)轉(zhuǎn)化為OML文檔的轉(zhuǎn)換方法及裝置
- XML數(shù)據(jù)的處理方法和裝置
- 一種XML注入漏洞檢測(cè)與防御方法





