[發(fā)明專利]基于電子書的排版處理方法、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010972636.8 | 申請日: | 2020-09-16 |
| 公開(公告)號: | CN112100978B | 公開(公告)日: | 2022-07-08 |
| 發(fā)明(設(shè)計)人: | 張恒 | 申請(專利權(quán))人: | 掌閱科技股份有限公司 |
| 主分類號: | G06F40/106 | 分類號: | G06F40/106;G06F40/189;G06T11/60 |
| 代理公司: | 北京市浩天知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11276 | 代理人: | 劉蘭蘭 |
| 地址: | 100124 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 電子書 排版 處理 方法 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開了一種基于電子書的排版處理方法、電子設(shè)備及存儲介質(zhì),該方法包括:獲取針對電子書的原始頁面內(nèi)容進(jìn)行解析后得到的頁面元素,識別所述頁面元素中包含的多個路徑類元素;根據(jù)所述多個路徑類元素在所述原始頁面內(nèi)容中的位置信息,對所述多個路徑類元素進(jìn)行分組處理,得到元素分組集合;根據(jù)所述元素分組集合確定所述原始頁面內(nèi)容中包含的圖片區(qū)域,針對所述圖片區(qū)域執(zhí)行截圖處理,得到與所述圖片區(qū)域相對應(yīng)的截圖圖片;根據(jù)所述截圖圖片生成與所述原始頁面內(nèi)容相對應(yīng)的頁面排版內(nèi)容。該方式能夠識別由路徑線構(gòu)成的圖片,并保留圖片本身的構(gòu)圖方式,使最終得到的排版內(nèi)容與電子書原始內(nèi)容一致,進(jìn)而提升了排版的效率和準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)領(lǐng)域,具體涉及一種基于電子書的排版處理方法、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
在電子書排版過程中,需要針對版式排版的電子書原稿進(jìn)行識別,并根據(jù)識別結(jié)果通過流式排版方式實現(xiàn)自定義效果的排版。其中,電子書原稿通常為PDF等不可編輯的格式。在針對電子書原稿進(jìn)行識別的過程中,能夠自動識別出原稿中的各種頁面元素,具體包括文字類元素、圖片類元素等多種類型。然后,根據(jù)識別結(jié)果自動轉(zhuǎn)換至流式文檔中實現(xiàn)自定義排版。
但是,在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中的上述方案至少存在下述缺陷:為了豐富圖片的展示效果,電子書中的部分圖片并非由單一的圖片元素構(gòu)成,而是通過一些其他類型的頁面元素組合而成。相應(yīng)地,若直接根據(jù)解析得到的各個頁面元素進(jìn)行排版,則會破壞圖片本身的構(gòu)圖方式,從而使最終得到的排版內(nèi)容與電子書原始內(nèi)容不一致。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的基于電子書的排版處理方法、電子設(shè)備及存儲介質(zhì)。
根據(jù)本發(fā)明的一個方面,提供了一種基于電子書的排版處理方法,包括:
獲取針對電子書的原始頁面內(nèi)容進(jìn)行解析后得到的頁面元素,識別所述頁面元素中包含的多個路徑類元素;
根據(jù)所述多個路徑類元素在所述原始頁面內(nèi)容中的位置信息,對所述多個路徑類元素進(jìn)行分組處理,得到元素分組集合;
根據(jù)所述元素分組集合確定所述原始頁面內(nèi)容中包含的圖片區(qū)域,針對所述圖片區(qū)域執(zhí)行截圖處理,得到與所述圖片區(qū)域相對應(yīng)的截圖圖片;
根據(jù)所述截圖圖片生成與所述原始頁面內(nèi)容相對應(yīng)的頁面排版內(nèi)容。
根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;
所述存儲器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行方法中的各項操作。
根據(jù)本發(fā)明的又一方面,提供了一種計算機(jī)存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行上述方法中的各項操作。
在本發(fā)明提供的基于電子書的排版處理方法、電子設(shè)備及存儲介質(zhì)中,能夠識別頁面元素中包含的多個路徑類元素,并根據(jù)多個路徑類元素在原始頁面內(nèi)容中的位置信息進(jìn)行分組處理,得到元素分組集合;進(jìn)而根據(jù)元素分組集合確定原始頁面內(nèi)容中包含的圖片區(qū)域,通過截圖處理得到與圖片區(qū)域相對應(yīng)的截圖圖片。由于截圖圖片已經(jīng)轉(zhuǎn)換為一個完整的圖片元素,因此,不會破壞原有圖片中的構(gòu)圖方式。由此可見,該方式能夠識別由路徑線構(gòu)成的圖片,并保留圖片本身的構(gòu)圖方式,使最終得到的排版內(nèi)容與電子書原始內(nèi)容一致,進(jìn)而提升了排版的效率和準(zhǔn)確性。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于掌閱科技股份有限公司,未經(jīng)掌閱科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010972636.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種建筑用挖地基裝置
- 下一篇:電能表進(jìn)出線接反快速查驗儀





