[發明專利]從LaTeX格式到XML格式的轉換系統及轉換方法在審
| 申請號: | 201710196087.8 | 申請日: | 2017-03-29 |
| 公開(公告)號: | CN106777404A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 李小偉;龍迪 | 申請(專利權)人: | 北京億科天元信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京奧翔領智專利代理有限公司11518 | 代理人: | 路遠 |
| 地址: | 100102 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | latex 格式 xml 轉換 系統 方法 | ||
1.一種從LaTeX格式到XML格式的轉換系統,其特征在于,包括LaTeX文件存儲區、LaTeX語法定義文件數據庫、LaTeX文件拆分模塊、LaTeX轉換器模塊、特殊符號轉換器模塊、臨時文件存儲區、文檔規范轉換器模塊和XML存儲區;LaTeX文件存儲區輸出數據至LaTeX文件拆分模塊進行文件拆分,LaTeX轉換器模塊按照LaTeX語法定義文件的規則,將LaTeX格式解釋成XML格式的數據,將LaTeX格式的公式轉換成MathML格式的數據;特殊符號轉換器模塊根據特殊符號定義文件將LaTeX文中的轉義符識別成特殊符號,輸出到臨時文件存儲區,文檔規范轉換器模塊將臨時文件存儲區的XML內容進行標準化規范,規范化的XML文件輸出至XML存儲區內。
2.根據權利要求1所述的從LaTeX格式到XML格式的轉換系統,其特征在于,所述LaTeX文件拆分模塊內包括正文前內容識別模塊、正文內容識別模塊、圖表內容識別模塊和參考文獻識別模塊。
3.根據權利要求1所述的從LaTeX格式到XML格式的轉換系統,其特征在于,所述LaTeX語法定義文件數據庫內存儲有正文前語法定義數據,正文語法定義數據,圖表語法定義數據和參考文獻語法定義數據。
4.根據權利要求1所述的從LaTeX格式到XML格式的轉換系統,其特征在于,LaTeX轉換器模塊包括LaTeX語法分析器和MathML公式轉換器,所述LaTeX語法分析器模塊將LaTeX格式解釋成XML數據,所述MathML公式轉換器模塊將LaTeX中的公式內容轉換成MathML標準的數據。
5.根據權利要求1所述的從LaTeX格式到XML格式的轉換系統,其特征在于,還包括特殊符號定義文件數據庫,所述特殊符號定義文件數據庫內存儲有特殊符號定義文件。
6.根據權利要求1所述的從LaTeX格式到XML格式的轉換系統,其特征在于,所述文檔規范轉換器包括ATA文檔規范模塊、DITA文檔規范模塊、DOCBOOK文檔規范模塊、JATS文檔規范模塊、NLM文檔規范模塊和S1000D文檔規范模塊。
7.一種從LaTeX格式到XML格式的轉換方法,其特征在于,包括如下步驟:
S1,將LaTeX文件輸入到LaTeX文件存儲區存儲,等待轉換;
S2,LaTex文件拆分模塊將LaTeX文件分解成正文前,正文,圖表,參考文獻數據塊;
S3,LaTeX轉換器中的LaTeX語法分析器讀取LaTeX語法定義文件得到語法解釋規則,LaTeX語法分析器模塊將正文前,正文,圖表,參考文獻數據塊解釋成XML格式的數據;將LaTeX格式的公式轉換成MathML格式的數據;
S4,特殊符號轉換器模塊將各數據中的特殊符號轉義符替換成特殊符號,放入臨時文件存儲區;
S5,當待轉換文件完全轉換為臨時的XML格式數據后,LaTeX轉換器將臨時的XML格式數據傳送至文檔規范編輯模塊,對臨時的XML格式數據進行規范化編輯,使臨時的XML格式文件形成符合文檔規范的XML格式數據;
S6,將符合文檔規范的XML格式數據生成XML文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京億科天元信息技術有限公司,未經北京億科天元信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710196087.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息推送方法和裝置
- 下一篇:高填方涵洞涵頂垂直土壓力計算方法





