[發明專利]一種基于源文件的word圖文格式編排系統及其實現方法在審
| 申請號: | 201711379063.2 | 申請日: | 2017-12-19 |
| 公開(公告)號: | CN108052496A | 公開(公告)日: | 2018-05-18 |
| 發明(設計)人: | 吳建州;李勇波;季統凱 | 申請(專利權)人: | 國云科技股份有限公司 |
| 主分類號: | G06F17/25 | 分類號: | G06F17/25 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 523808 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 源文件 word 圖文 格式 編排 系統 及其 實現 方法 | ||
1.一種基于源文件的word圖文格式編排系統,其特征在于:所述的系統包括源文件解析器、動態數據組裝器和文檔編排器;
所述的源文件解析器,使用POI讀取源文件獲取文本格式標簽、圖片格式標簽和示例片段,然后生成格式標簽庫;
所述的動態數據組裝器,將動態數據中的圖片流和文本數據按格式標簽進行分組生成標簽數據哈希圖;
所述的文檔編排器,復制源文件生成新文檔,使用POI讀取新文檔格式匹配標簽數據哈希圖,將匹配成功的圖片流和文本數據寫入新文檔對應位置,完成新文檔編排。
2.根據權利要求1所述的系統,其特征在于:所述的文本格式標簽包括段落序號、表格序號、字體系列碼、字號、顏色碼和樣式序號六種元素,其中樣式序號是同一種樣式在不同段落或序列的排序號。
3.根據權利要求1或2所述的系統,其特征在于:所述的圖片格式標簽包括段落序號、表格序號、序列序號和圖片序號四種元素。
4.一種根據權利要求1、2或3任一項所述的系統的實現方法,其特征在于:所述的方法具體步驟如下:
第一步,使用POI按段落讀取源文件,獲取段落下所有序列,遍歷序列判斷當前是文本序列還是圖片序列;
第二步,針對文本序列獲取格式包括字體系列碼、字號和顏色碼,判斷和段落格式哈希圖中上一個格式是否相同,如果不同則生成新格式并加入到段落格式哈希圖,如果相同則將文本內容累加到段落格式哈希圖對應的值中;針對圖片序列根據段落序號、序列序號和圖片序號生成圖片格式標簽;
第三步,使用POI按表格讀取源文件,獲取表格下所有單元格,遍歷單元格獲取所有序列,遍歷序列判斷當前是文本序列還是圖片序列;
第四步,針對文本序列獲取格式包括字體系列碼、字號和顏色碼,判斷和表格格式哈希圖中上一個格式是否相同,如果不同則生成新格式并加入到表格格式哈希圖,如果相同則將文本內容累加到表格格式哈希圖對應的值中;針對圖片序列根據表格序號、序列序號和圖片序號生成圖片格式標簽;
第五步,截取段落格式哈希圖和表格格式哈希圖中的文本值,生成示例片斷;
第六步,匯總段落格式哈希圖、表格格式哈希圖和圖片格式標簽生成格式標簽庫;
第七步,根據格式標簽庫將動態數據中的圖片流和文本數據進行分組,生成標簽數據哈希圖;
第八步,復制源文件生成新文檔,使用POI按段落讀取新文檔,獲取段落下所有序列,合并相同格式序列,匹配標簽數據哈希圖,將匹配成功的圖片流和文本數據寫入新文檔對應位置;
第九步,使用POI按表格讀取新文檔,獲取表格下所有單元格,遍歷單元格獲取所有序列,合并相同格式序列,匹配標簽數據哈希圖,將匹配成功的圖片流和文本數據寫入新文檔對應位置,最終完成新文檔編排。
5.根據權利要求4所述的方法,其特征在于:所述的第一步與第二為一組;第三步與第四為一組;兩組順序可以互換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國云科技股份有限公司,未經國云科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711379063.2/1.html,轉載請聲明來源鉆瓜專利網。





