[發(fā)明專利]從LaTeX格式到XML格式的轉(zhuǎn)換系統(tǒng)及轉(zhuǎn)換方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710196087.8 | 申請(qǐng)日: | 2017-03-29 |
| 公開(kāi)(公告)號(hào): | CN106777404A | 公開(kāi)(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計(jì))人: | 李小偉;龍迪 | 申請(qǐng)(專利權(quán))人: | 北京億科天元信息技術(shù)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京奧翔領(lǐng)智專利代理有限公司11518 | 代理人: | 路遠(yuǎn) |
| 地址: | 100102 北京市朝陽(yáng)區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | latex 格式 xml 轉(zhuǎn)換 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及文件格式轉(zhuǎn)換技術(shù),特別涉及一種從LaTeX到XML格式的文件轉(zhuǎn)換系統(tǒng)及其轉(zhuǎn)換方法。
背景技術(shù)
在現(xiàn)有技術(shù)中,出版行業(yè)許多專業(yè)期刊的文獻(xiàn)是用LaTeX(音譯“拉泰赫”)格式來(lái)書(shū)寫(xiě),LaTeX格式雖然利于印刷出版,但是不利于閱讀。LaTeX文件是非結(jié)構(gòu)化數(shù)據(jù),不能在互聯(lián)網(wǎng)環(huán)境下很好的存儲(chǔ),展示;不能與國(guó)外專業(yè)文獻(xiàn)網(wǎng)站進(jìn)行對(duì)接;不利于在互聯(lián)網(wǎng)的各個(gè)平臺(tái)間進(jìn)行數(shù)據(jù)交互,數(shù)據(jù)共享。
發(fā)明內(nèi)容
針對(duì)上述現(xiàn)有技術(shù)中的缺點(diǎn)和不足,本發(fā)明的目的在于提供一種能夠?qū)崿F(xiàn)LaTeX文件到符合國(guó)際規(guī)范的結(jié)構(gòu)化數(shù)據(jù)(XML)轉(zhuǎn)換的系統(tǒng)以及對(duì)應(yīng)此系統(tǒng)的轉(zhuǎn)換方法。
本發(fā)明的目的是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
一種從LaTeX格式到XML格式的轉(zhuǎn)換系統(tǒng),包括LaTeX文件存儲(chǔ)區(qū)、LaTeX語(yǔ)法定義文件數(shù)據(jù)庫(kù)、LaTeX文件拆分模塊、LaTeX轉(zhuǎn)換器模塊、特殊符號(hào)轉(zhuǎn)換器模塊、臨時(shí)文件存儲(chǔ)區(qū)、文檔規(guī)范轉(zhuǎn)換器模塊和XML存儲(chǔ)區(qū);LaTeX文件存儲(chǔ)區(qū)輸出數(shù)據(jù)至LaTeX文件拆分模塊進(jìn)行文件拆分,LaTeX轉(zhuǎn)換器模塊按照LaTeX語(yǔ)法定義文件的規(guī)則,將LaTeX格式解釋成XML格式的數(shù)據(jù),將LaTeX格式的公式轉(zhuǎn)換成MathML格式的數(shù)據(jù);特殊符號(hào)轉(zhuǎn)換器模塊根據(jù)特殊符號(hào)定義文件將LaTeX文中的轉(zhuǎn)義符識(shí)別成特殊符號(hào),輸出到臨時(shí)文件存儲(chǔ)區(qū),文檔規(guī)范轉(zhuǎn)換器模塊將臨時(shí)文件存儲(chǔ)區(qū)的XML內(nèi)容進(jìn)行標(biāo)準(zhǔn)化規(guī)范,規(guī)范化的XML文件輸出至XML存儲(chǔ)區(qū)內(nèi)。
優(yōu)選地,所述LaTeX文件拆分模塊內(nèi)包括正文前內(nèi)容識(shí)別模塊、正文內(nèi)容識(shí)別模塊、圖表內(nèi)容識(shí)別模塊和參考文獻(xiàn)識(shí)別模塊。
優(yōu)選地,所述LaTeX語(yǔ)法定義文件數(shù)據(jù)庫(kù)內(nèi)存儲(chǔ)有正文前語(yǔ)法定義數(shù)據(jù),正文語(yǔ)法定義數(shù)據(jù),圖表語(yǔ)法定義數(shù)據(jù)和參考文獻(xiàn)語(yǔ)法定義數(shù)據(jù)。
優(yōu)選地,LaTeX轉(zhuǎn)換器模塊包括LaTeX語(yǔ)法分析器和MathML公式轉(zhuǎn)換器,所述LaTeX語(yǔ)法分析器模塊將LaTeX格式解釋成XML數(shù)據(jù),所述MathML公式轉(zhuǎn)換器模塊將LaTeX中的公式內(nèi)容轉(zhuǎn)換成MathML標(biāo)準(zhǔn)的數(shù)據(jù)。
優(yōu)選地,還包括特殊符號(hào)定義文件數(shù)據(jù)庫(kù),所述特殊符號(hào)定義文件數(shù)據(jù)庫(kù)內(nèi)存儲(chǔ)有特殊符號(hào)定義文件。
優(yōu)選地,所述文檔規(guī)范轉(zhuǎn)換器包括ATA文檔規(guī)范模塊、DITA文檔規(guī)范模塊、DOCBOOK文檔規(guī)范模塊、JATS文檔規(guī)范模塊、NLM文檔規(guī)范模塊、S1000D文檔規(guī)范模塊和其他待開(kāi)發(fā)文檔規(guī)范模塊。
一種從LaTeX格式到XML格式的轉(zhuǎn)換方法,包括如下步驟:
S1,將LaTeX文件輸入到LaTeX文件存儲(chǔ)區(qū)存儲(chǔ),等待轉(zhuǎn)換;
S2,LaTex文件拆分模塊將LaTeX文件分解成正文前,正文,圖表,參考文獻(xiàn)數(shù)據(jù)塊;
S3,LaTeX轉(zhuǎn)換器中的LaTeX語(yǔ)法分析器讀取LaTeX語(yǔ)法定義文件得到語(yǔ)法解釋規(guī)則,LaTeX語(yǔ)法分析器模塊將正文前,正文,圖表,參考文獻(xiàn)數(shù)據(jù)塊解釋成XML格式的數(shù)據(jù);將LaTeX格式的公式轉(zhuǎn)換成MathML格式的數(shù)據(jù);
S4,特殊符號(hào)轉(zhuǎn)換器模塊將各數(shù)據(jù)中的特殊符號(hào)轉(zhuǎn)義符替換成特殊符號(hào),放入臨時(shí)文件存儲(chǔ)區(qū);
S5,當(dāng)待轉(zhuǎn)換文件完全轉(zhuǎn)換為臨時(shí)的XML格式數(shù)據(jù)后,LaTeX轉(zhuǎn)換器將臨時(shí)的XML格式數(shù)據(jù)傳送至文檔規(guī)范編輯模塊,對(duì)臨時(shí)的XML格式數(shù)據(jù)進(jìn)行規(guī)范化編輯,使臨時(shí)的XML格式文件形成符合文檔規(guī)范的XML格式數(shù)據(jù);
S6,將符合文檔規(guī)范的XML格式數(shù)據(jù)生成XML文件。
與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例至少具有以下優(yōu)點(diǎn):
本發(fā)明從LaTeX格式到XML格式的轉(zhuǎn)換系統(tǒng)及轉(zhuǎn)換方法可以將LaTeX格式文件轉(zhuǎn)換為符合國(guó)際規(guī)范的結(jié)構(gòu)化數(shù)據(jù),從而使得許多專業(yè)期刊的文獻(xiàn)與國(guó)外專業(yè)文獻(xiàn)網(wǎng)站進(jìn)行對(duì)接,可以實(shí)現(xiàn)跨平臺(tái)進(jìn)行數(shù)據(jù)展示,以及對(duì)文章能夠統(tǒng)一進(jìn)行內(nèi)容管理。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例從LaTeX到XML格式的文件轉(zhuǎn)換系統(tǒng)的功能框圖;
圖2為本發(fā)明從LaTeX格式到XML格式的轉(zhuǎn)換方法的流程示意圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京億科天元信息技術(shù)有限公司,未經(jīng)北京億科天元信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710196087.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:信息推送方法和裝置
- 下一篇:高填方涵洞涵頂垂直土壓力計(jì)算方法
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 從LaTeX格式到XML格式的轉(zhuǎn)換系統(tǒng)及轉(zhuǎn)換方法
- 一種PDF文件中公式的排版方法及裝置
- 顯示公式圖片的獲取方法、轉(zhuǎn)存公式圖片的方法及裝置
- 一種Word文檔向LaTeX文檔轉(zhuǎn)換的方法及系統(tǒng)
- 圖像識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 導(dǎo)出帶MathType公式的Word文檔方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于latex墨水打印的PP展架
- 一種LaTeX公式顯示方法及裝置
- 一種用于教育資源庫(kù)的公式處理方法及系統(tǒng)
- 一種食品及飼料中真菌毒素特別是黃曲霉毒素B1的快速檢測(cè)方法
- Java中的XML類型
- 數(shù)據(jù)庫(kù)中XML模式的原地演進(jìn)
- 在標(biāo)記語(yǔ)言環(huán)境中使用可撤消命令來(lái)編輯文檔的文檔處理和管理方法
- XML文檔管理系統(tǒng)及其方法與XML文檔訪問(wèn)控制方法
- 用于處理用于在XML數(shù)據(jù)庫(kù)中存儲(chǔ)的非XML文檔的方法和系統(tǒng)
- 一種XML元數(shù)據(jù)對(duì)象化解析方法及系統(tǒng)
- 一種XML信息獲取方法和系統(tǒng)
- 將XML文檔自動(dòng)轉(zhuǎn)化為OML文檔的轉(zhuǎn)換方法及裝置
- XML數(shù)據(jù)的處理方法和裝置
- 一種XML注入漏洞檢測(cè)與防御方法
- 圖像轉(zhuǎn)換設(shè)備、圖像轉(zhuǎn)換電路及圖像轉(zhuǎn)換方法
- 數(shù)模轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 轉(zhuǎn)換設(shè)備和轉(zhuǎn)換方法
- 占空比轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 通信轉(zhuǎn)換方法、轉(zhuǎn)換裝置及轉(zhuǎn)換系統(tǒng)
- 模數(shù)轉(zhuǎn)換和模數(shù)轉(zhuǎn)換方法
- 轉(zhuǎn)換模塊以及轉(zhuǎn)換電路
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件和熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊





