[發明專利]一種文檔自動排版方法、裝置、設備及存儲介質在審
| 申請號: | 202010909982.1 | 申請日: | 2020-09-02 |
| 公開(公告)號: | CN112016290A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 李威;張勇 | 申請(專利權)人: | 湖南寫邦科技有限公司 |
| 主分類號: | G06F40/189 | 分類號: | G06F40/189 |
| 代理公司: | 長沙科永臻知識產權代理事務所(普通合伙) 43227 | 代理人: | 楊琦玲 |
| 地址: | 410205 湖南省長沙市高新開*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文檔 自動 排版 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種文檔自動排版方法、裝置、設備及存儲介質,所述方法包括以下步驟:獲取待處理源文件;從預設配置文件庫選擇與所述待處理源文件相對應的配置文件,所述配置文件表征文檔配置參數信息;根據所述配置文件對所述待處理源文件進行排版處理;根據排版處理結果,生成自動排版文件,通過對文檔的自動讀取和排版,減少了人與系統的交互,提高了文檔排版的效率,同時能夠自動的配置非文本類型的格式,提高了自動排版的適用范圍,擴大了更多的使用場景。
技術領域
本發明涉及文檔制作技術領域,特別涉及一種文檔自動排版方法、裝置、設備及存儲介質。
背景技術
現有的論文自動排版工具(武漢大學本科生論文自動排版工具)要求用戶在工具界面手動錄入畢業論文的各個部分,包括一級標題,二級標題,三級標題,中英文摘要,各章節的正文部分,參考文獻,致謝等。軟件根據用戶錄入的各個部分,把內容輸出到一個word文檔,并根據參數自動設置好各部分的格式,并自動生成頁碼和目錄。
它的缺點有:1.自動排版工具無法直接讀取已有的word文檔,論文內容需要從界面指定的位置分別手動錄入各個部分(包括一級標題,二級標題,三級標題,中英文摘要,各章節的正文部分,參考文獻,致謝等)。2.自動排版工具只能錄入論文的文本內容,不支持圖片,表格及公式的錄入,需要用戶在工具生成的word文檔中自行補充。
因此亟需新的技術方案解決現有技術存在的問題。
發明內容
針對現有技術的上述問題,本發明的目的在于,提供一種文檔自動排版方法、裝置、設備及存儲介質,能實現對文檔內容的自動排版。
為了解決上述技術問題,本發明的具體技術方案如下:
一方面,本發明提供一種文檔自動排版方法,包括以下步驟:
獲取待處理源文件;
從預設配置文件庫選擇與所述待處理源文件相對應的配置文件,所述配置文件表征文檔配置參數信息;
根據所述配置文件對所述待處理源文件進行排版處理;
根據排版處理結果,生成自動排版文件。
進一步地,所述獲取待處理源文件之前還包括建立預設配置文件庫,所述預設配置文件庫包括多組配置文件,
所述建立預設配置文件庫包括:
從不同規范單位獲取相應的文檔規范要求,所述文檔規范要求包括文檔的配置參數信息;
針對每種文檔規范要求,建立相應地配置文件,以使待處理源文件能根據所述配置文件進行自動排版。
進一步地,所述根據所述配置文件對所述待處理源文件進行排版處理包括:
獲取所述待處理源文件的結構元素類型,所述結構元素類型包括文本、圖片、表格和公式中的一種或幾種;
根據結構元素類型,對所述待處理源文件進行排版處理;
當所述結構元素類型為文本時,按照預設正則表達式對文本信息進行提取歸類,得到不同文本類型的文本信息;
對歸類得到的文本信息,按照配置文件的參數設置具體的格式。
進一步地,所述獲取所述待處理源文件的結構元素類型,所述結構元素類型包括文本、圖片、表格和公式中的一種或幾種之前還包括:源文件標準化處理,
具體地,所述源文件標準化處理包括:
獲取文檔的頁面結構信息,并格式化處理;
獲取文檔的頁碼結構信息,并格式化處理;
獲取文檔的目錄結構信息,并格式化處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南寫邦科技有限公司,未經湖南寫邦科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010909982.1/2.html,轉載請聲明來源鉆瓜專利網。





