[發明專利]一種基于源文件的word圖文格式編排系統及其實現方法在審
| 申請號: | 201711379063.2 | 申請日: | 2017-12-19 |
| 公開(公告)號: | CN108052496A | 公開(公告)日: | 2018-05-18 |
| 發明(設計)人: | 吳建州;李勇波;季統凱 | 申請(專利權)人: | 國云科技股份有限公司 |
| 主分類號: | G06F17/25 | 分類號: | G06F17/25 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 523808 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 源文件 word 圖文 格式 編排 系統 及其 實現 方法 | ||
本發明涉及計算機應用技術領域,特別是一種基于源文件的word圖文格式編排系統及其實現方法。本發明的系統由源文件解析器、動態數據組裝器和文檔編排器構成。源文件解析器使用POI讀取源文件獲取文本格式標簽、圖片格式標簽和示例片段生成格式標簽庫;動態數據組裝器將動態數據中的圖片流和文本數據按格式標簽進行分組生成標簽數據哈希圖;文檔編排器復制源文件生成新文檔,使用POI讀取新文檔格式匹配標簽數據哈希圖,將匹配成功的圖片流和文本數據寫入新文檔對應位置,最終完成新文檔編排。本發明具有擴展性好、適用范圍廣等特點,可有效地應用于多種需要對word文檔自動編排的系統中。
技術領域
本發明涉及計算機應用技術領域,特別是一種基于源文件的word圖文格式編排系統及其實現方法。
背景技術
word文檔編輯、排版工作是件即費時又費力且細致的工作,重復類似的文檔開發工作需要花費較多人力資源及時間。常規的word文檔編排通過定義參數變量進行Range匹配替換或者轉成XML格式匹配替換,在word版本通用性、圖片處理及模板格式的完整保留等方面存在不足且解析替換操作復雜。這時候更需要一種靈活度高且適用范圍廣的方法,可以快速響應業務需求,實現快速開發。
發明內容
本發明解決的技術問題之一在于提供一種基于源文件的word圖文格式編排系統,靈活地實現word文檔的編輯、排版。
本發明解決的技術問題之二在于提供一種基于源文件的word圖文格式編排系統的實現方法。
本發明解決上述技術問題之一的技術方案是:
所述的系統包括源文件解析器、動態數據組裝器和文檔編排器;
所述的源文件解析器,使用POI讀取源文件獲取文本格式標簽、圖片格式標簽和示例片段,然后生成格式標簽庫;
所述的動態數據組裝器,將動態數據中的圖片流和文本數據按格式標簽進行分組生成標簽數據哈希圖;
所述的文檔編排器,復制源文件生成新文檔,使用POI讀取新文檔格式匹配標簽數據哈希圖,將匹配成功的圖片流和文本數據寫入新文檔對應位置,完成新文檔編排。
所述的文本格式標簽包括段落序號、表格序號、字體系列碼、字號、顏色碼和樣式序號六種元素,其中樣式序號是同一種樣式在不同段落或序列的排序號。
所述的圖片格式標簽包括段落序號、表格序號、序列序號和圖片序號四種元素。
本發明解決上述技術問題之二的技術方案是:
所述的方法具體步驟如下:
第一步,使用POI按段落讀取源文件,獲取段落下所有序列,遍歷序列判斷當前是文本序列還是圖片序列;
第二步,針對文本序列獲取格式包括字體系列碼、字號和顏色碼,判斷和段落格式哈希圖中上一個格式是否相同,如果不同則生成新格式并加入到段落格式哈希圖,如果相同則將文本內容累加到段落格式哈希圖對應的值中;針對圖片序列根據段落序號、序列序號和圖片序號生成圖片格式標簽;
第三步,使用POI按表格讀取源文件,獲取表格下所有單元格,遍歷單元格獲取所有序列,遍歷序列判斷當前是文本序列還是圖片序列;
第四步,針對文本序列獲取格式包括字體系列碼、字號和顏色碼,判斷和表格格式哈希圖中上一個格式是否相同,如果不同則生成新格式并加入到表格格式哈希圖,如果相同則將文本內容累加到表格格式哈希圖對應的值中;針對圖片序列根據表格序號、序列序號和圖片序號生成圖片格式標簽;
第五步,截取段落格式哈希圖和表格格式哈希圖中的文本值,生成示例片斷;
第六步,匯總段落格式哈希圖、表格格式哈希圖和圖片格式標簽生成格式標簽庫;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國云科技股份有限公司,未經國云科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711379063.2/2.html,轉載請聲明來源鉆瓜專利網。





