[發明專利]一種PDF文檔的版面重排方法在審
| 申請號: | 202010083557.1 | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111241805A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 呂海港 |
| 主分類號: | G06F40/189 | 分類號: | G06F40/189 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 030001 山西*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 pdf 文檔 版面 重排 方法 | ||
為了給PDF文檔留下足夠的空間用于添加注釋,本發明提供一種PDF文檔的版面重排方法,包括導入PDF文檔每頁的頁面信息,提取BT和ET之間文本及其排版信息,把這些矢量文本進行縱向壓縮,橫向保持不變,替換對應的文本及其排版信息,生成版面重排的頁面,所有頁面組合成版面重排后的新PDF文檔。版面重排后的PDF文檔的文本行間距變大,足以放下一行注釋文字,原版面基本不變,不影響閱讀。
技術領域
本發明涉及文檔排版領域,特別涉及一種PDF文檔的版面重排方法。
背景技術
隨著信息技術的快速發展,大量信息和資料以PDF文檔的形式保存和傳播。 PDF文檔無論在哪種PDF閱讀器上,無論在哪種打印機上,無論在哪種操作系統下,都可保證精確的顏色和準確的顯示/打印效果,忠實地再現原稿排版效果,包括每一個字符、顏色和圖像。
在閱讀PDF文檔時,用戶經常希望對文檔進行一些注釋。因此,大多數PDF閱讀器,比如Adobe Acrobat Reader,福昕PDF閱讀器,迅捷PDF閱讀器,都有文檔注釋功能。但是,PDF文檔的頁面一般都比較緊湊,只有兩側的空白處才能用于注釋,不僅空間有限,而且用戶閱讀起來也很不方便,嚴重地限制了PDF文檔的注釋功能。
為了解決PDF文檔的注釋展示空間不足的問題,需要對PDF文檔的頁面進行重新排版,從而給注釋擠出一定的展示空間。
發明內容
本發明所要解決的技術問題是,將PDF頁面進行重新排版,為注釋留下一定的展示空間。
為解決上述技術問題,本發明所采用的技術方案是一種PDF文檔的版面重排方法,包括導入PDF文檔每頁的頁面信息,提取BT和ET之間文本及其排版信息,把這些矢量文本進行縱向壓縮,橫向保持不變,替換對應的文本及其排版信息,生成版面重排的頁面,所有版面重排后的頁面組合成新的PDF文檔。
所述的把這些矢量文本進行縱向壓縮,縱向壓縮系數(壓縮后文本高度與原文本的比值)為60%至80%。
所述的把這些矢量文本進行縱向壓縮,橫向保持不變,可以通過文本變換操作Tm的縱向縮放參數乘以縱向壓縮系數,同時位移操作Td和TD的縱向參數放大到縱向壓縮系數的倒數倍來實現的。
所述的把這些矢量文本進行縱向壓縮,橫向保持不變,也可以通過字體大小操作Tf乘以縱向壓縮系數,同時橫向縮放操作Tz放大到縱向壓縮系數的倒數倍來實現。
本發明有三點有益效果:(1)每行文本上方都有了相對充足的空間用于展示注釋;(2)由于文本的寬度不變,PDF的版面完全保持原來的布局;(3)文本雖然高度變小,但是寬度完全不變,原文依然清晰可讀,僅僅影響了一些美觀。
附圖說明
圖1為本發明PDF文檔的版面重排前后的對比圖。
圖2為本發明PDF文檔的不同壓縮系數下版面重排后的對比圖。
具體實施方式
下面結合附圖和實施例對本發明做進一步闡述。
本發明的實施例采用開源軟件iText軟件包(https://itextpdf.com/)對PDF文檔進行解析和修改。
因為PDF的頁面是獨立的,本實施例只選擇一頁PDF文檔,其余頁按照實施方式同樣處理即可。實施例選用的正式出版物的英文期刊《Physical Review Letters》的一篇文章:Competition for Graphene: Graphynes with Direction-Dependent Dirac Cones(https://journals.aps.org/ prl/abstract/ 10.1103/ PhysRevLett.108.086804)的PDF版本作為例子進行說明。
實施例1
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于呂海港,未經呂海港許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010083557.1/2.html,轉載請聲明來源鉆瓜專利網。





