[發(fā)明專利]一種電子文檔的歷史版本數(shù)據(jù)處理方法及裝置有效
| 申請?zhí)枺?/td> | 200910091814.X | 申請日: | 2009-08-28 |
| 公開(公告)號: | CN101996161A | 公開(公告)日: | 2011-03-30 |
| 發(fā)明(設(shè)計)人: | 王毅;仇睿恒;張磊;王曉磊 | 申請(專利權(quán))人: | 北大方正集團有限公司;北京北大方正技術(shù)研究院有限公司;北京大學(xué) |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F17/30 |
| 代理公司: | 北京天昊聯(lián)合知識產(chǎn)權(quán)代理有限公司 11112 | 代理人: | 陳源;羅建民 |
| 地址: | 100871 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電子 文檔 歷史 版本 數(shù)據(jù)處理 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及電子文檔數(shù)據(jù)處理領(lǐng)域,尤其涉及一種電子文檔的歷史版本數(shù)據(jù)處理方法及裝置。
背景技術(shù)
現(xiàn)在很多電子文檔格式采用“物理容器+文檔模型”的架構(gòu)來描述和存儲數(shù)據(jù),其中,文檔模型中包括各類數(shù)據(jù)描述文件,比如,文檔主入口文件、安全性描述文件、資源描述文件等,物理容器主要用于存儲數(shù)據(jù),就好像一個虛擬存儲系統(tǒng)(Virtual?Storage?System),將文檔模型中的各類數(shù)據(jù)描述文件組織起來。大多數(shù)的電子文檔格式采用Zip包作為物理容器,比如微軟的OOXML和XPS等。也有一些電子文檔格式采用其它的物理容器,比如Adobe的PDF采用文本文件作為物理容器。
在電子文檔應(yīng)用中,往往會涉及到對文檔進(jìn)行修改。考慮到數(shù)據(jù)存儲效率,采用增量修改的方式對文檔進(jìn)行修改。增量修改是指將用戶編輯修改的數(shù)據(jù)作為一個增加的部分進(jìn)行存儲,而不是對被編輯的對象數(shù)據(jù)直接進(jìn)行修改。增量修改的優(yōu)點在于,一是由于不需要對文檔整體進(jìn)行重新存儲,只需要在文檔中附加增加部分的數(shù)據(jù)即可,所以可最大限度地減少文件需要移動的數(shù)據(jù)量,提高數(shù)據(jù)存儲的效率;二是保留了所有的歷史數(shù)據(jù),這樣可以對文檔的歷史版本進(jìn)行追溯,在很多修訂的場景下非常有用。
但是,對于采用Zip包作為物理容器的電子文檔,由于Zip無法實現(xiàn)增量修改的功能,因此也無法對文檔的歷史版本進(jìn)行追溯。而對于現(xiàn)有的支持增量修改的電子文檔,比如PDF和DOC,盡管支持增量修改,但是它們是直接通過文檔格式中的某些數(shù)據(jù)結(jié)構(gòu)來進(jìn)行歷史追溯的,這種方式是和文檔模型直接耦合的。比如,PDF采用交叉索引表(Cross-reference?Table)來進(jìn)行歷史追溯,而交叉索引表是基于PDF的頁面對象(object)的索引,頁面對象描述在文檔模型中定義,因此交叉索引表與文檔模型直接耦合。如圖1所示,每次對PDF文檔進(jìn)行一次增量修改,在物理容器中就增加一個交叉索引表,通過這些交叉索引表獲取文檔的歷史版本。如果有另外一種文檔格式想復(fù)用PDF的增量修改和歷史版本追溯模型,就必須完全采用PDF的頁面對象組織方式。也就是說,對于不同的文檔格式,由于其文檔模型不同,我們往往需要設(shè)計新的增量修改和歷史版本追溯方式。
此外,由于版本追溯方式和文檔模型耦合太緊密,導(dǎo)致無法很好地區(qū)分開物理容器的歷史版本和文檔模型的歷史版本,這樣,就無法實現(xiàn)對于真正的文檔歷史的追溯。如圖1所示,物理容器中的交叉索引表與文檔模型直接耦合,因此難以分離物理容器的歷史版本和文檔模型的歷史版本。舉例來講,每次對文檔進(jìn)行增量修改時,可能會認(rèn)為物理容器和文檔模型都會增加一個歷史版本,但實際上文檔模型的版本可能并沒有改變,應(yīng)用系統(tǒng)可能是通過數(shù)字簽名等方式來確定文檔模型的歷史版本。在這種情況下,就不能正確地進(jìn)行文檔的歷史版本追溯。另外,物理容器版本和文檔模型版本耦合太緊密還會造成這樣的問題,即,不同的文檔模型難以復(fù)用同一個物理容器,同一個文檔模型難以選用不同的物理容器。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問題,本發(fā)明提出了一種電子文檔的歷史版本數(shù)據(jù)處理方法及裝置,以通過降低物理容器和文檔模型之間的版本信息耦合性來實現(xiàn)便于不同的文檔格式復(fù)用的歷史版本追溯方法。
為了實現(xiàn)以上目的,本發(fā)明提供一種電子文檔的歷史版本數(shù)據(jù)處理方法,該方法包括以下步驟:在電子文檔中建立歷史映射表,所述歷史映射表表示物理容器的歷史版本和文檔模型的歷史版本的映射關(guān)系;和當(dāng)物理容器的歷史版本和文檔模型的歷史版本同時更新時,更新歷史映射表。
可在電子文檔文檔模型的入口位置之前建立歷史映射表。歷史映射表可由二元組序列組成,每個二元組序列包括物理容器的歷史版本號和文檔模型的歷史版本號。所述更新歷史映射表的步驟可包括將更新的物理容器的歷史版本號和文檔模型的歷史版本號組成所述二元組添加到歷史映射表中的步驟。
對經(jīng)過上述處理的電子文檔進(jìn)行歷史版本追溯時,根據(jù)需要得到的文檔模型的歷史版本,在歷史映射表中查找對應(yīng)的物理容器的歷史版本,然后在物理容器中提取對應(yīng)版本的數(shù)據(jù)。
根據(jù)本發(fā)明的電子文檔的歷史版本數(shù)據(jù)處理裝置包括:歷史映射表建立單元,在電子文檔中建立歷史映射表,所述歷史映射表表示物理容器的歷史版本和文檔模型的歷史版本的映射關(guān)系;和歷史映射表更新單元,當(dāng)物理容器的歷史版本和文檔模型的歷史版本同時更新時,更新歷史映射表。
該裝置還可包括:電子文檔保存單元,每次更新歷史映射表時,保存電子文檔;和歷史版本追溯單元,根據(jù)需要得到的文檔模型的歷史版本,在歷史映射表中查找對應(yīng)的物理容器的歷史版本,然后在物理容器中提取對應(yīng)版本的數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北大方正集團有限公司;北京北大方正技術(shù)研究院有限公司;北京大學(xué),未經(jīng)北大方正集團有限公司;北京北大方正技術(shù)研究院有限公司;北京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910091814.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:輸電線路雷擊故障定位裝置
- 下一篇:一種滑觸供電小車的專用檢測裝置





