[發(fā)明專利]一種Word文檔向PowerPoint文檔轉(zhuǎn)換的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201910246945.4 | 申請日: | 2019-03-29 |
| 公開(公告)號: | CN110083580B | 公開(公告)日: | 2022-12-30 |
| 發(fā)明(設(shè)計(jì))人: | 宋軍;徐衡;彭艷;朱超群;曹威;張坤;吳雅笛 | 申請(專利權(quán))人: | 中國地質(zhì)大學(xué)(武漢) |
| 主分類號: | G06F16/178 | 分類號: | G06F16/178;G06F40/109;G06F40/126;G06F40/151;G06F40/186 |
| 代理公司: | 武漢知產(chǎn)時代知識產(chǎn)權(quán)代理有限公司 42238 | 代理人: | 方琳 |
| 地址: | 430000 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 word 文檔 powerpoint 轉(zhuǎn)換 方法 系統(tǒng) | ||
本發(fā)明提供了一種Word文檔向PowerPoint文檔轉(zhuǎn)換的方法及系統(tǒng),利用Apache JACOB技術(shù)對Microsoft Office Word中文檔的文本內(nèi)容、數(shù)據(jù)格式、相對位置等信息進(jìn)行分析,通過Apache POI技術(shù)提供的方法索引并提取該Word文檔中的圖片、表格等數(shù)據(jù),并將提取的數(shù)據(jù)內(nèi)容保存在本地。利用Apriori算法,根據(jù)文檔屬性的區(qū)別,分別選取最為近似或者匹配度最高的元素轉(zhuǎn)換策略,形成最佳的圖片、表格、公式等目標(biāo)元素信息流,利用各元素形成的信息流,結(jié)合源Word文檔中圖片、文本內(nèi)容、表格等數(shù)據(jù)的相對位置信息,生成最終的目標(biāo)文檔信息流。最后將形成的文檔信息流寫入到Microsoft Office PowerPoint文檔中。
技術(shù)領(lǐng)域
本發(fā)明涉及文檔轉(zhuǎn)換和數(shù)據(jù)處理領(lǐng)域,具體涉及一種Word文檔向PowerPoint文檔轉(zhuǎn)換的方法及系統(tǒng)。
背景技術(shù)
Microsoft Office Word是微軟公司的一個文字處理器應(yīng)用程序,提供了許多易于使用的文檔創(chuàng)建工具和豐富的功能集,也是目前市場最流行、最常見的文字處理器。Microsoft OfficePowerPoint是微軟公司的演示文稿軟件,可以為用戶創(chuàng)建演示文稿,在互聯(lián)網(wǎng)上召開面對面會議、遠(yuǎn)程會議等給觀眾展示演示文稿。文檔轉(zhuǎn)換是將Word、Pdf、Txt、Odf、Html等文檔格式進(jìn)行轉(zhuǎn)化。Microsoft Office Word本身提供了Word向PowerPoint轉(zhuǎn)換功能,但在實(shí)際使用過程中,操作過程復(fù)雜。對于用戶來說,實(shí)際使用價值不高。其次,對于編碼方式不同的word文檔,實(shí)現(xiàn)向PowerPoint轉(zhuǎn)換具有一定的困難性,不能轉(zhuǎn)換成理想的演示文稿。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對上述目前現(xiàn)有的文檔轉(zhuǎn)換技術(shù)轉(zhuǎn)化功能單一、實(shí)際使用價值不高的技術(shù)問題,提供一種Word文檔向PowerPoint文檔轉(zhuǎn)換的方法及系統(tǒng),能夠?qū)崿F(xiàn)不同類型文檔之間的轉(zhuǎn)換,降低多文檔呈現(xiàn)的難度,提高文檔使用的高效性。
一種Word文檔向PowerPoint文檔轉(zhuǎn)換的方法,包括:
S1、提交Microsoft Office Word文檔文件,對文件中文本、圖片、表格、公式數(shù)據(jù)進(jìn)行初始分析;
S2、結(jié)合Dispatch分析參數(shù)提取Microsoft Office Word文檔文件中的數(shù)據(jù)的內(nèi)容、類型及格式信息,類型包括文本、圖片、表格和公式;
S3、利用Apriori算法,根據(jù)文檔屬性值的區(qū)別,分別選取最為近似或者匹配度最高的元素轉(zhuǎn)換策略,形成最佳的圖片、公式、表格及文本段落目標(biāo)元素信息流;
S4、利用各目標(biāo)元素信息流,結(jié)合源Word文件中圖片、表格、段落、公式目標(biāo)元素的相對位置信息,生成最終的目標(biāo)文檔信息流;
S5、根據(jù)用戶需求,在母版類中選擇合適的母版;
S6、將形成的目標(biāo)文檔信息流寫入到Microsoft Office PowerPoint母版中;
S7、判斷是否需要繼續(xù)新建一張幻燈片;若是,則進(jìn)行步驟S8;否則,進(jìn)行步驟S9;
S8、根據(jù)用戶選擇的母版新建一張幻燈片;
S9、結(jié)束Word文檔向PowerPoint文檔的轉(zhuǎn)換。
進(jìn)一步的,所述步驟S1中,Microsoft Office Word文檔中不同的元素所存儲的形式存在明顯差異,圖片、公式、文本、表格不同文檔元素提取到的數(shù)據(jù)格式、存儲方式均不同。
進(jìn)一步的,所述步驟S2包括:
S21、通過Apache JACOB中所提供的方法索引并讀取文檔中段落內(nèi)容、格式、相對位置信息;
S22、通過Apache POI中提供的方法索引并提取該Word文檔的所有圖片及表格數(shù)據(jù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國地質(zhì)大學(xué)(武漢),未經(jīng)中國地質(zhì)大學(xué)(武漢)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910246945.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像轉(zhuǎn)換設(shè)備、圖像轉(zhuǎn)換電路及圖像轉(zhuǎn)換方法
- 數(shù)模轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 轉(zhuǎn)換設(shè)備和轉(zhuǎn)換方法
- 占空比轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 通信轉(zhuǎn)換方法、轉(zhuǎn)換裝置及轉(zhuǎn)換系統(tǒng)
- 模數(shù)轉(zhuǎn)換和模數(shù)轉(zhuǎn)換方法
- 轉(zhuǎn)換模塊以及轉(zhuǎn)換電路
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件和熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊





