[發(fā)明專利]論文文檔的處理方法、處理裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910955356.3 | 申請日: | 2019-10-09 |
| 公開(公告)號: | CN112651217A | 公開(公告)日: | 2021-04-13 |
| 發(fā)明(設(shè)計)人: | 辛洋;皮霞林 | 申請(專利權(quán))人: | 珠海金山辦公軟件有限公司;北京金山辦公軟件股份有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/117 |
| 代理公司: | 北京柏杉松知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 | 代理人: | 丁蕓;馬敬 |
| 地址: | 519015 廣東省珠海市高新*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 論文 文檔 處理 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種論文文檔的處理方法,其特征在于,所述方法包括:
獲取待處理論文文檔中各個段落的樣式屬性,所述樣式屬性用于表示各段落的段落樣式和字體樣式;
基于所述樣式屬性中的編號樣式和編號內(nèi)容,將具有相同編號樣式且編號內(nèi)容連續(xù)的段落所組成的最大段落區(qū)間對應(yīng)的部分,確定為所述待處理論文文檔的正文部分,所述正文部分中包括:標(biāo)題段落和文本內(nèi)容段落;
確定所述正文部分中的不同標(biāo)題段落的論文元素,以及各標(biāo)題段落對應(yīng)的文本內(nèi)容段落的論文元素;其中,一個所述論文元素用于表示論文文檔中具有相同樣式屬性的段落;
確定所述待處理論文文檔的非正文部分的論文元素,所述非正文部分為所述待處理論文文檔中除所述正文部分外的其他部分;
根據(jù)論文模板中預(yù)設(shè)的不同論文元素與不同樣式屬性的對應(yīng)關(guān)系,為所述待處理論文文檔中所確定的各個論文元素所對應(yīng)的段落設(shè)置新的樣式屬性。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取待處理論文文檔中各個段落的樣式屬性的步驟,包括:
至少獲取所述待處理論文文檔中具有編號的段落的編號格式以及編號內(nèi)容。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述樣式屬性中的編號樣式和編號內(nèi)容,將具有相同編號樣式且編號內(nèi)容連續(xù)的段落所組成的最大段落區(qū)間對應(yīng)的部分,確定為所述待處理論文文檔的正文部分的步驟,包括:
將具有相同編號樣式且編號內(nèi)容連續(xù)的段落劃分至一個段落區(qū)間,得到多個段落區(qū)間;
將所述多個段落區(qū)間中的最大段落區(qū)間對應(yīng)的文本部分確定為正文部分;其中,所述正文部分的起始位置為所述最大段落區(qū)間的起始位置,所述正文部分的結(jié)束位置為所述最大段落區(qū)間后最近的含有預(yù)設(shè)關(guān)鍵詞的位置。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述正文部分中的不同標(biāo)題段落的論文元素,以及各標(biāo)題段落對應(yīng)的文本內(nèi)容段落的論文元素的步驟,包括:
將具有相同編號樣式的所述標(biāo)題段落識別為同一個層級;
確定不同層級對應(yīng)的論文元素,以及所述文本內(nèi)容段落對應(yīng)的論文元素;所述論文元素用于表示論文文檔中各段落的樣式屬性。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述待處理論文文檔的非正文部分的論文元素的步驟,包括:
針對所述待處理論文文檔的非正文部分,按照預(yù)先建立的不同預(yù)設(shè)關(guān)鍵詞與不同論文元素的對應(yīng)關(guān)系,確定在所述非正文部分中所識別出的預(yù)設(shè)關(guān)鍵詞對應(yīng)的論文元素,作為該預(yù)設(shè)關(guān)鍵詞所在段落的論文元素;
確定該預(yù)設(shè)關(guān)鍵詞所在段落的下一段落對應(yīng)的論文元素。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,論文模板中預(yù)設(shè)有不同論文元素與不同樣式屬性的對應(yīng)關(guān)系,所述根據(jù)論文模板中預(yù)設(shè)的不同論文元素與不同樣式屬性的對應(yīng)關(guān)系,為所述待處理論文文檔中所確定的各個論文元素所對應(yīng)的段落設(shè)置新的樣式屬性的步驟,包括:
為所述待處理論文文檔生成索引,所述索引表示所述待處理論文文檔中段落序號與不同論文元素的對應(yīng)關(guān)系,所述段落序號為段落在所述待處理論文文檔所有段落中按順序排列的序號;
在所述論文模板中查找第一論文元素,所述第一論文元素為與所述索引中記錄的論文元素類型相同的論文元素;
獲取所述第一論文元素的第一樣式屬性,第一樣式屬性為所述第一論文元素在所述論文模板中對應(yīng)的樣式屬性;
根據(jù)所述第一樣式屬性,確定第二樣式屬性,所述第二樣式屬性為所述索引中論文元素的樣式屬性;
將所述第二樣式屬性設(shè)置到與索引中論文元素對應(yīng)的段落序號所在的段落上。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述待處理論文文檔的非正文部分的論文元素步驟之后,所述方法還包括:
建立空白文檔;
將所述待處理論文文檔內(nèi)容復(fù)制到所述空白文檔中,所述空白文檔中包含索引。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于珠海金山辦公軟件有限公司;北京金山辦公軟件股份有限公司,未經(jīng)珠海金山辦公軟件有限公司;北京金山辦公軟件股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910955356.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





