[發明專利]XML格式文檔轉換為Word格式文檔的系統和方法有效
| 申請號: | 201010285320.8 | 申請日: | 2010-09-17 |
| 公開(公告)號: | CN101963955A | 公開(公告)日: | 2011-02-02 |
| 發明(設計)人: | 解輝 | 申請(專利權)人: | 深圳市萬興軟件有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 深圳市君勝知識產權代理事務所 44268 | 代理人: | 劉文求;韓金明 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | xml 格式 文檔 轉換 word 系統 方法 | ||
技術領域
本發明涉及格式文檔轉換的系統領域,更具體的說,改進涉及的是一種XML格式文檔轉換為Word格式文檔的系統和方法。
背景技術
Microsoft?Word是微軟公司的一個文字處理應用程序,在辦公自動化中,Microsoft?Word得到了越來越多的應用。然而,在自動化辦公應用非常廣泛的今天,如何根據已有的大量XML(Extensible?Markup?Language,可擴展標記語言)信息高效、穩定地批量生成Word文檔,已成為迫切的需求。
現有的技術中,有的通過調用一些成熟的開源文檔編輯軟件的接口來實現MS-Word基本信息的寫入,較流行的是調用OpenOffice的API接口來實現Word文檔的生成。還有的通過研究doc二進制文件的信息,來猜測MS-Word文件的寫入規則,之后利用猜測到的規則來實現Word文檔的生成。
但是,現有的技術中調用OpenOffice的API接口生成Word文檔的做法,由于doc文件的內部格式沒有公開,所以當今一些主流的開源軟件對其支持的并不完美,經常會造成元素丟失和排版混亂的情況。而現有的技術中依靠猜測MS-Word文件的寫入規則生成Word文檔的做法,由于僅僅是猜測doc文件的寫入規則,現在情況下僅能支持一些簡單元素的輸入和簡單排版的設置,對復雜文檔支持較差,并且只能支持單一Word版本文檔的生成,無法實現批量生成Word文檔。
因此,現有技術尚有待改進和發展。
發明內容
本發明的目的在于,提供一種XML格式文檔轉換為Word格式文檔的系統和方法,可支持Word格式的排版風格,可避免頻繁地調用MS-Word的Com接口而導致占用較多的系統資源,可穩定高效批量地將XML格式文檔轉換為Word格式文檔。
本發明的技術方案如下:
一種XML格式文檔轉換為Word格式文檔的方法,其中,包括以下步驟:
讀取XML格式文檔中的基本元素信息;
按照Word格式文檔的排版風格對讀取的基本元素信息進行排版處理;
將排版處理后的信息生成RTF格式文檔;
調用MS-Word的Com接口將RTF格式文檔轉換為Word格式文檔。
所述的XML格式文檔轉換為Word格式文檔的方法,其中,在讀取XML格式文檔基本元素信息的步驟中,具體包括以下步驟:
通過XML文件讀取模塊中的XML讀取庫將基本元素讀出;
按照基本元素的類型對元素進行分組,對各組的元素按照層次順序進行重新排列;
將重新排列后的元素信息輸入到中間數據結構中。
所述的XML格式文檔轉換為Word格式文檔的方法,其中,在進行Word格式文檔風格排版處理的步驟中,對于類型為文本的基本元素,包括以下步驟:
對多個文本塊進行橫向切割;
判斷縱向區間內同一垂直方向上是否存在有兩個文本塊;
在否的情況下將文本塊合并成行。
所述的XML格式文檔轉換為Word格式文檔的方法,其中,在進行Word格式文檔風格排版處理的步驟中,對于類型為文本的基本元素,包括以下步驟:
對多個文本行進行縱向切割;
判斷橫向區間內同一水平方向上是否存在有兩個文本行;
在否的情況下將文本行合并成一個文本段。
所述的XML格式文檔轉換為Word格式文檔的方法,其中,在進行Word格式文檔風格排版處理的步驟中,對于類型為圖元和圖像的基本元素,包括以下步驟:
若一個圖元或者圖像的區域位于一個文本段的區域內,則將該圖元或者圖像作為該文本段的背景信息;
若該圖元或者圖像的區域超過了一個文本塊的區域,則將該圖元或者圖像作為整個頁面的背景信息。
所述的XML格式文檔轉換為Word格式文檔的方法,其中,在生成RTF格式文檔的步驟中,還包括以下步驟:
每生成一個文本或者圖元,都要先在顏色表中查詢該顏色是否存在,如果存在則提取該顏色的索引值,如果不存在則在顏色表中新建該顏色對象并提取該顏色的索引值。
所述的XML格式文檔轉換為Word格式文檔的方法,其中,在生成RTF格式文檔的步驟中,還包括以下步驟:
每生成一個文本對象都要查詢該文本的字體在字體表中是否存在,如果存在則將該字體在字體表中的索引值作為輸入值進行輸入,如果不存在則在字體表中新建該字體對象并將新建字體對象的索引值作為輸入值進行輸入。
所述的XML格式文檔轉換為Word格式文檔的方法,其中,在生成RTF格式文檔的步驟中,還包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市萬興軟件有限公司,未經深圳市萬興軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010285320.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:搖臂機構以及搖臂機構的安裝方法
- 下一篇:膨脹機





