[發(fā)明專利]版式文檔的重排方法、系統(tǒng)及電子閱讀終端有效
| 申請(qǐng)?zhí)枺?/td> | 201410341665.9 | 申請(qǐng)日: | 2014-07-17 |
| 公開(公告)號(hào): | CN105446946B | 公開(公告)日: | 2019-08-02 |
| 發(fā)明(設(shè)計(jì))人: | 劉孫亮 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06F17/24 | 分類號(hào): | G06F17/24 |
| 代理公司: | 北京清源匯知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11644 | 代理人: | 馮德魁 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 版式 文檔 重排 方法 系統(tǒng) 電子 閱讀 終端 | ||
本申請(qǐng)公開一種版式文檔的重排方法,其包括:獲取與版式文檔分開存儲(chǔ)的流式標(biāo)記數(shù)據(jù),該流式標(biāo)記數(shù)據(jù)根據(jù)預(yù)設(shè)的邏輯信息結(jié)構(gòu)與版式文檔之間建立對(duì)應(yīng)關(guān)系;根據(jù)流式標(biāo)記數(shù)據(jù)查找版式文檔中對(duì)應(yīng)的文檔內(nèi)容,來對(duì)版式文檔進(jìn)行重排。與此同時(shí),本申請(qǐng)還公開一種版式文檔的重排系統(tǒng)及電子閱讀終端,其將標(biāo)記后的流式標(biāo)記數(shù)據(jù)與版式文檔分開存儲(chǔ),在重排時(shí)根據(jù)流式標(biāo)記數(shù)據(jù)來解析版式文檔,這樣流式標(biāo)記數(shù)據(jù)就不會(huì)對(duì)原始文檔造成影響,使得在不修改不破壞原始文檔的情況下,可以有效地提高版式文檔的重排效果和重排效率;同時(shí),標(biāo)記后的流式標(biāo)記數(shù)據(jù)可以容易地被多用戶多終端共享,有助于電子設(shè)備的技術(shù)升級(jí)。
技術(shù)領(lǐng)域
本申請(qǐng)涉及數(shù)字閱讀技術(shù),尤其涉及一種版式文檔的重排方法、系統(tǒng)及電子閱讀終端。
背景技術(shù)
隨著互聯(lián)網(wǎng)的蓬勃發(fā)展及硬件水平的不斷提升,電子文檔正在逐步取代傳統(tǒng)的圖書和紙質(zhì)文檔。同時(shí),人們的閱讀習(xí)慣也不再局限于傳統(tǒng)的紙質(zhì)出版物,電子閱讀(或稱數(shù)字閱讀)比重正在逐漸變大。由于各種手機(jī)、電子書等便攜性電子設(shè)備的流行,使得人們可以利用生活中的碎片時(shí)間進(jìn)行電子閱讀,例如乘坐公交、地鐵時(shí)就可以閱讀電子圖書。在巨大的市場需求下,對(duì)于電子閱讀的信息提供及處理方式也提出了更高的要求。
眾所周知,電子文檔分為流式文檔和版式文檔。流式文檔的基本單位是字符,它是有序字符的集合,長度為該文件所包含的字符個(gè)數(shù)。如Word文件就是一種流式文檔,其主要記錄流式信息,其中也可以加入某些定版的對(duì)象(如圖像漂浮等)。版式文檔作為一種絕對(duì)描述方式,在自定義的坐標(biāo)系中,明確記錄每個(gè)文檔的位置和尺寸等,從而使得文檔打印出來的結(jié)果和計(jì)算機(jī)上瀏覽的結(jié)構(gòu)一致,而且在任何計(jì)算機(jī)環(huán)境下具有顯示一致性的特點(diǎn),由此可以保證真實(shí)地重現(xiàn)文檔的原貌。如pdf、xps、ceb等文件就是較為典型的版式文檔,它們具有版面固定、所見即所得(What you see is what you get,WYSIWYG)等特點(diǎn),因而非常適合于成文后的文件發(fā)布、傳播和存檔。
流式文檔不存在電子閱讀的排版障礙,目前已經(jīng)有成熟的排版引擎可以適用。對(duì)于版式文檔而言,則經(jīng)常會(huì)因?yàn)榘婷婀潭ǘ谛∑聊辉O(shè)備下導(dǎo)致閱讀不便。如果版式文檔的一個(gè)頁面的內(nèi)容在設(shè)備的屏幕上顯示,將受到文字、圖像等太小而看不清楚等諸多限制;若對(duì)頁面進(jìn)行放大或縮小操作,將勢必影響用戶的閱讀體驗(yàn)。這就要求電子閱讀終端能夠突破版式文檔顯示固定的局限性,以便可以根據(jù)版式文檔的內(nèi)容重新進(jìn)行排版,最終保證用戶具有較好的閱讀體驗(yàn)。
對(duì)于版式文檔的重排問題,業(yè)界紛紛推出了各種解決方案。實(shí)現(xiàn)版式文檔重排的現(xiàn)有方案主要有以下兩種:
一種現(xiàn)有版式文檔的重排方案是:為了補(bǔ)救在各種電子設(shè)備上閱讀電子文檔的需要,在制作相應(yīng)的版式文檔時(shí)標(biāo)記版面的流式顯示信息,并把標(biāo)記數(shù)據(jù)存儲(chǔ)于原始文檔中一起發(fā)布。這種重排方案中,以版式文檔中精確定位的版面描述為基礎(chǔ),在其中附加足夠的流式邏輯結(jié)構(gòu)信息用來支持重排、抽取表格結(jié)構(gòu)等流式應(yīng)用。例如,Adobe在1999年推出的PDF1.3規(guī)范中引入了Logical Structure(邏輯結(jié)構(gòu)),并在2001年推出的PDF1.4產(chǎn)品中引入了tagged PDF來完善流式信息的表達(dá),之后又在其發(fā)布的MARS文檔格式中使用XML對(duì)這部分信息進(jìn)行結(jié)構(gòu)化的描述。這種xml標(biāo)記語言,在理論上可以描述一切格式,如Word新版本的Docx就是基于xml進(jìn)行描述的。此外,方正阿帕比在2010年發(fā)布的CEBXv1.1規(guī)范中定義了包含文章、章節(jié)、段落、片段、塊的多層可嵌套的樹狀邏輯結(jié)構(gòu),其中的塊通過直接引用版式頁面上的版面塊或圖元(v1.2)來實(shí)現(xiàn)數(shù)據(jù)共享,由此可以支持在移動(dòng)終端等電子閱讀設(shè)備上的實(shí)時(shí)排版和屏幕自適應(yīng)顯示,具體的標(biāo)準(zhǔn)手冊(cè)及軟件可參考方正阿帕比的官方網(wǎng)站(http://www.apabi.cn/download/index.html)上的有關(guān)介紹。
另一種現(xiàn)有版式文檔的重排方案是:在打開一個(gè)版式文檔時(shí),通過某些預(yù)設(shè)的算法和規(guī)則,對(duì)版面信息進(jìn)行解析,并根據(jù)解析的結(jié)果,交給排版引擎來進(jìn)行實(shí)時(shí)重排,即通過實(shí)時(shí)排版來進(jìn)行屏幕自適應(yīng)顯示。這種版式文檔的實(shí)時(shí)重排方法,目前在各種電子閱讀終端上得到廣泛使用。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410341665.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





