[發(fā)明專利]一種文件打包、提取的方法和裝置有效
| 申請?zhí)枺?/td> | 200910202918.3 | 申請日: | 2009-05-18 |
| 公開(公告)號: | CN101655877A | 公開(公告)日: | 2010-02-24 |
| 發(fā)明(設(shè)計)人: | 仇睿恒;湯幟;王毅 | 申請(專利權(quán))人: | 北京大學(xué);北大方正集團(tuán)有限公司;北京方正阿帕比技術(shù)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 | 代理人: | 黃志華 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文件 打包 提取 方法 裝置 | ||
1.一種文件打包的方法,其特征在于,包括:
收集待打包的文件,其中,每個文件由至少一個文件項來描述,每個文件 項包含多個用于描述文件內(nèi)容的文件信息;
將所有文件項進(jìn)行排序,并將排序后的文件項進(jìn)行合并;
將所有文件項組合為至少一個集合;
將每個集合中的每個文件項所包含的文件信息分為至少兩組;
在每個集合中將組標(biāo)識相同的各組中的文件信息組合成一個集合組;
根據(jù)所述集合中各集合組的集合組標(biāo)識將各集合組中的文件信息寫入包 文件。
2.如權(quán)利要求1所述的方法,其特征在于,其中,所述進(jìn)行排序的方式 包括下述方式中的至少一種:
按照文件系統(tǒng)的結(jié)構(gòu)層次前序排列;
按照實際使用時文件項的訪問順序排列;
按照文件名稱或路徑名稱排列;
按照收集文件項時的收集順序排列。
3.如權(quán)利要求1所述的方法,其特征在于,所述文件信息中包含表示多 個數(shù)據(jù)編碼方法排列順序的數(shù)據(jù)編碼方法序列;
所述根據(jù)所述集合中各集合組的集合組標(biāo)識將各集合組中的文件信息寫 入包文件之前,還包括:
根據(jù)所述數(shù)據(jù)編碼方法序列對所述文件信息中包含的數(shù)據(jù)進(jìn)行數(shù)據(jù)編碼 處理。
4.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述集合中各集合 組的集合組標(biāo)識將各集合組中的文件信息寫入包文件之后,還包括:
收集包含修改文件內(nèi)容的文件項,并取出所述包文件內(nèi)的所有文件項;
將從所述包文件中取出的文件項與收集到的包含修改文件內(nèi)容的文件項 進(jìn)行合并;
將合并后的文件項寫入包文件。
5.如權(quán)利要求4所述的方法,其特征在于,所述文件信息中包含操作, 所述操作是將所述包文件作為一個虛擬的存儲設(shè)備,在該存儲設(shè)備上進(jìn)行的文 件系統(tǒng)操作,并且每個文件項的文件信息中只包含一個操作。
6.如權(quán)利要求5所述的方法,其特征在于,所述合并包括將操作具有邏 輯關(guān)系的文件項進(jìn)行合并,并將多個文件項中重復(fù)的文件信息刪減為一份,所 述多個文件項是描述同一文件的多個文件項。
7.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述集合中各集合 組的集合組標(biāo)識將各集合組中的文件信息寫入包文件之后,還包括:
收集包含修改文件內(nèi)容的文件項,并取出所述包文件內(nèi)的所有文件項;
將收集到的包含修改文件內(nèi)容的文件項與對應(yīng)修改的從所述包文件中取 出的文件項組合成一個文件項;
將組合后的文件項中包含的文件信息分為至少兩組,并將所有文件項中包 含文件數(shù)據(jù)的組中包含的文件信息按照使用時的順序進(jìn)行排序;
將排序后得到的各組中的文件信息寫入包文件。
8.如權(quán)利要求7所述的方法,其特征在于,所述將排序后得到的各組中 的文件信息寫入包文件,包括:
將排序后的所有文件項組合為一個集合;
在該集合中將組標(biāo)識相同的各組中的文件信息組合成一個集合組,得到兩 個集合組:文件描述信息塊和文件數(shù)據(jù)信息塊;
將文件描述信息塊寫入包文件的開始部分,將文件數(shù)據(jù)信息塊寫入到所述 文件描述信息塊后面,并設(shè)置文件描述信息塊中的ItemOffset指向文件數(shù)據(jù)信 息塊的偏移位置。
9.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述集合中各集合 組的集合組標(biāo)識將各集合組中的文件信息寫入包文件之后,還包括:
收集包含修改文件內(nèi)容的文件項;
將收集到的包含修改文件內(nèi)容的文件項寫到所述包文件尾部。
10.如權(quán)利要求9所述的方法,其特征在于,所述將收集到的包含修改文 件內(nèi)容的文件項寫到所述包文件尾部,包括:
在所述包文件尾部增加新的文件描述信息塊和文件數(shù)據(jù)信息塊;
將所述包文件中最后的文件描述信息塊的Next指針指向所述新的文件描 述信息塊的起始位置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué);北大方正集團(tuán)有限公司;北京方正阿帕比技術(shù)有限公司,未經(jīng)北京大學(xué);北大方正集團(tuán)有限公司;北京方正阿帕比技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910202918.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





