[發明專利]PDF文件處理方法及裝置在審
| 申請號: | 201710213998.7 | 申請日: | 2017-04-01 |
| 公開(公告)號: | CN108664457A | 公開(公告)日: | 2018-10-16 |
| 發明(設計)人: | 郭相軍 | 申請(專利權)人: | 北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/21 | 分類號: | G06F17/21 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 楊澤;劉芳 |
| 地址: | 100871 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字體 字節數 復合 內容流 解析 查找 | ||
1.一種PDF文件處理方法,其特征在于,包括:
判斷PDF文件中待拆分的字符是否為復合字體;
若為復合字體,則查找所述字符的CMap;
對查找到的CMap進行解析,確定所述字符的字節數;
根據所述字符的字節數以及PDF文件的內容流,對字符進行拆分。
2.根據權利要求1所述的方法,其特征在于,還包括:
向用戶顯示PDF文件中包含的全部字體類型,所述字體類型包括下述至少一項:Type1、TrueType、Type3、CID;
接收用戶根據所述PDF文件中的全部字體類型輸入的需要拆分的字體類型;
相應的,判斷PDF文件中待拆分的字符是否為復合字體,包括:
判斷待拆分的字符是否屬于用戶輸入的需要拆分的字體類型:若否,則跳過該字符進行下一字符的拆分;若是,則判斷所述待拆分的字符是否為復合字體。
3.根據權利要求1所述的方法,其特征在于,還包括:
接收用戶輸入的優先級信息,所述優先級信息包括各個字體類型對應的優先級;
相應的,在對PDF文件中的字符進行拆分時,優先級高的先進行拆分,優先級低的后進行拆分。
4.根據權利要求1所述的方法,其特征在于,還包括:
接收用戶輸入的水印替換信息,所述水印替換信息包括用戶期望使用的水印;
在對PDF文件中的字符進行拆分完成之后,查找PDF文件中的水印;
根據所述用戶期望使用的水印,對PDF文件中原有的水印進行替換。
5.根據權利要求1-4任一項所述的方法,其特征在于,在根據所述字符的字節數以及PDF文件的內容流,對字符進行拆分之后,還包括:
利用PDF中顯示字符串的操作符,把字符拆開來顯示。
6.一種PDF文件處理裝置,其特征在于,包括:
判斷模塊,用于判斷PDF文件中待拆分的字符是否為復合字體;
查找模塊,用于在待拆分字符為復合字體時,查找所述字符的CMap;
確定模塊,用于對查找到的CMap進行解析,確定所述字符的字節數;
拆分模塊,用于根據所述字符的字節數以及PDF文件的內容流,對字符進行拆分。
7.根據權利要求6所述的裝置,其特征在于,所述拆分模塊還用于:
向用戶顯示PDF文件中包含的全部字體類型,所述字體類型包括下述至少一項:Type1、TrueType、Type3、CID;
接收用戶根據所述PDF文件中的全部字體類型輸入的需要拆分的字體類型;
相應的,所述判斷模塊具體用于:
判斷待拆分的字符是否屬于用戶輸入的需要拆分的字體類型:若否,則跳過該字符進行下一字符的拆分;若是,則判斷所述待拆分的字符是否為復合字體。
8.根據權利要求6所述的裝置,其特征在于,所述拆分模塊還用于:
接收用戶輸入的優先級信息,所述優先級信息包括各個字體類型對應的優先級;
相應的,在對PDF文件中的字符進行拆分時,優先級高的先進行拆分,優先級低的后進行拆分。
9.根據權利要求6所述的裝置,其特征在于,所述拆分模塊還用于:
接收用戶輸入的水印替換信息,所述水印替換信息包括用戶期望使用的水印;
在對PDF文件中的字符進行拆分完成之后,查找PDF文件中的水印;
根據所述用戶期望使用的水印,對PDF文件中原有的水印進行替換。
10.根據權利要求6-9任一項所述的裝置,其特征在于,所述拆分模塊還用于:
在根據所述字符的字節數以及PDF文件的內容流,對字符進行拆分之后,利用PDF中顯示字符串的操作符,把字符拆開來顯示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京北大方正電子有限公司,未經北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710213998.7/1.html,轉載請聲明來源鉆瓜專利網。





