[發(fā)明專利]一種專利PDF文檔批量重命名的方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202010710312.7 | 申請(qǐng)日: | 2020-07-22 |
| 公開(公告)號(hào): | CN111858491A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉威葳;李智歡;劉淼;伍兆恒;趙澤;潘海平;肖應(yīng)輝 | 申請(qǐng)(專利權(quán))人: | 廣州兆和電力技術(shù)有限公司 |
| 主分類號(hào): | G06F16/16 | 分類號(hào): | G06F16/16;G06F16/17 |
| 代理公司: | 湖南兆弘專利事務(wù)所(普通合伙) 43008 | 代理人: | 趙朕毅;劉暢舟 |
| 地址: | 510640 廣東省廣州市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 專利 pdf 文檔 批量 重命名 方法 系統(tǒng) | ||
本發(fā)明公開了一種專利PDF文檔批量重命名的方法及系統(tǒng),本發(fā)明的方法包括:進(jìn)行參數(shù)配置并創(chuàng)建目的文件夾;從源文件夾中選取待處理的專利PDF文檔;解析出被選取的專利PDF文檔的文字內(nèi)容;刪除文字內(nèi)容中的報(bào)錯(cuò)字符,提取文字內(nèi)容中的有效信息;對(duì)被提取的有效信息重新編輯順序得到最終文件名,復(fù)制被選取的專利PDF文檔得到專利PDF文檔副本,將專利PDF文檔副本按照最終文件名重命名,將重命名后的專利PDF文檔副本保存到目的文件夾;更新日志,從源文件夾中繼續(xù)選取待處理的專利PDF文檔重命名直到源文件夾中的專利PDF文檔遍歷循環(huán)完畢。本發(fā)明能夠提取專利PDF文檔中的有效信息并批量重命名,方便科研人員快速辨識(shí)。
技術(shù)領(lǐng)域
本發(fā)明涉及PDF文檔處理,尤其涉及一種專利PDF文檔批量重命名的方法及系統(tǒng)。
背景技術(shù)
已公告的專利文檔通常以PDF文檔型式存在,PDF文檔的命名方式一般為《申請(qǐng)?zhí)?pdf》。當(dāng)保存在本地的PDF專利文檔較多時(shí),這種以申請(qǐng)?zhí)柮奈臋n不容易識(shí)別,造成查詢資料的不便。一般的方法是對(duì)該P(yáng)DF專利文檔進(jìn)行手動(dòng)重命名。當(dāng)PDF文檔成百上千時(shí),手動(dòng)命名耗時(shí)耗力。
為此,急需開發(fā)一種PDF文檔批量重命名的系統(tǒng)及方法,對(duì)PDF文檔中的有效信息進(jìn)行提取,批量重命名,方便科研人員快速辨識(shí)專利文檔。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題就在于:針對(duì)現(xiàn)有技術(shù)存在的技術(shù)問(wèn)題,本發(fā)明提供一種專利PDF文檔重命名的方法及系統(tǒng),能夠提取專利PDF文檔中的有效信息并批量重命名,方便科研人員快速辨識(shí)專利PDF文檔。
為解決上述技術(shù)問(wèn)題,本發(fā)明提出的技術(shù)方案為:
一種專利PDF文檔批量重命名的方法,包括以下步驟:
1)進(jìn)行參數(shù)配置并在默認(rèn)存儲(chǔ)路徑下創(chuàng)建用于保存重命名后的專利PDF文檔的目的文件夾;
2)從源文件夾中選取待處理的專利PDF文檔;
3)解析出被選取的專利PDF文檔的文字內(nèi)容;
4)篩選并刪除文字內(nèi)容中的報(bào)錯(cuò)字符,根據(jù)預(yù)設(shè)的匹配方法提取文字內(nèi)容中的有效信息,所述匹配方法包括:根據(jù)專利PDF文檔中專利類型、專利名稱、公告號(hào)、公告日、申請(qǐng)?zhí)枴⑸暾?qǐng)人、專利權(quán)人和摘要對(duì)應(yīng)部分的開始文字、結(jié)束文字以及中間文字的格式對(duì)文字內(nèi)容正則匹配;
5)對(duì)被提取的有效信息重新編輯順序得到最終文件名,復(fù)制被選取的專利PDF文檔得到專利PDF文檔副本,將專利PDF文檔副本按照最終文件名重命名,獲取用戶指定的存儲(chǔ)路徑,判斷用戶指定的存儲(chǔ)路徑和默認(rèn)存儲(chǔ)路徑是否一致,是則將重命名后的專利PDF文檔副本保存到用戶指定的存儲(chǔ)路徑下的目的文件夾,否則在用戶指定的存儲(chǔ)路徑下創(chuàng)建目的文件夾并將重命名后的專利PDF文檔副本保存到用戶指定的存儲(chǔ)路徑下的目的文件夾;
6)更新日志,判斷源文件夾中的專利PDF文檔是否遍歷循環(huán)完畢,是則結(jié)束并退出,否則返回步驟2)。
進(jìn)一步的,步驟4)具體包括以下步驟:
4.1)獲取文字內(nèi)容;
4.2)篩選并刪除文字內(nèi)容中的報(bào)錯(cuò)字符;
4.3)根據(jù)專利PDF文檔中專利類型、專利名稱、公告號(hào)、公告日、申請(qǐng)?zhí)枴⑸暾?qǐng)人、專利權(quán)人和摘要對(duì)應(yīng)部分中開始文字、結(jié)束文字以及中間文字的格式分別創(chuàng)造匹配專利類型、專利名稱、公告號(hào)、公告日、申請(qǐng)?zhí)枴⑸暾?qǐng)人、專利權(quán)人和摘要的正則表達(dá)式,通過(guò)各正則表達(dá)式分別對(duì)文字內(nèi)容正則匹配得到有效信息;
4.4)建立字典,將有效信息保存到字典中。
進(jìn)一步的,步驟5)具體包括以下步驟:
5.1)獲取字典、用戶指定的存儲(chǔ)路徑和當(dāng)前被選取的專利PDF文檔;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州兆和電力技術(shù)有限公司,未經(jīng)廣州兆和電力技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010710312.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備





