[發明專利]一種在word文檔中提取英文縮略語的方法和系統在審
| 申請號: | 202210072746.8 | 申請日: | 2022-01-21 |
| 公開(公告)號: | CN114528828A | 公開(公告)日: | 2022-05-24 |
| 發明(設計)人: | 葉曉新;張海勇;徐歡歡;邱小麗;鄭佩 | 申請(專利權)人: | 深圳市吉祥騰達科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284 |
| 代理公司: | 深圳市海順達知識產權代理有限公司 44831 | 代理人: | 歐陽士 |
| 地址: | 518000 廣東省深圳市南山區西麗*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 word 文檔 提取 英文 縮略語 方法 系統 | ||
1.一種在word文檔中提取英文縮略語的方法,其特征在于,包括以下步驟:
S1:讀取word文檔中的全部語句,并將全部語句分割成單詞格式;
S2:去除重復的單詞及單詞前后的標點符號,并生成單詞列表;
S3:提取所述單詞列表中存在兩個以上大寫字母的單詞,并生成初選縮略語列表;
S4:讀取過濾文件,并將所述過濾文件中的單詞與所述初選縮略語列表進行匹配,其中,所述過濾文件中存儲有含兩個以上大寫字母的非縮略語單詞;
S5:刪除所述初選縮略語列表中與所述過濾文件中重復的單詞,生成精選縮略語列表;
S6:輸出所述精選選縮略語列表。
2.如權利要求1所述的在word文檔中提取英文縮略語的方法,其特征在于,在執行步驟S1之前,還包括以下步驟:
A1:接收用戶輸入的word文檔的文件名稱;
A2:判斷當前路徑是否存在所述文件名稱,若存在,則執行步驟S1,若不存在,則提示錯誤。
3.如權利要求1所述的在word文檔中提取英文縮略語的方法,其特征在于,在步驟S1中,包括以下步驟:
S11:讀取所述word文檔中文本部分的全部語句;
S12:讀取所述word文檔中表格部分的全部語句:
S13:將全部語句分割成單詞格式。
4.如權利要求1所述的在word文檔中提取英文縮略語的方法,其特征在于,在步驟S3中,包括以下步驟:
S31:提取所述單詞列表中首字母為大寫的單詞;
S32:提取首字母大寫的單詞中,除首字母外還存在至少一個大寫字母的單詞;
S33:保存提取的單詞,并生成初選縮略語列表。
5.如權利要求1所述的在word文檔中提取英文縮略語的方法,其特征在于,在執行步驟S4之前,還包括以下步驟:
B1:接收用戶錄入含兩個以上大寫字母的非縮略語單詞;
B2:將所述非縮略語單詞存儲到所述過濾文件內。
6.如權利要求1所述的在word文檔中提取英文縮略語的方法,其特征在于,在步驟S6中,包括以下步驟:
S61:根據當前時間生成Excel文件,并將所述精選縮略語列表中的單詞寫入所述Excel文件中;
S62:對所述精選縮略語列表中的單詞進行排序;
S63:保存并輸出所述Excel文件。
7.如權利要求6所述的在word文檔中提取英文縮略語的方法,其特征在于,在步驟S61中,對所述精選縮略語列表中的單詞進行排序的方式為依照單詞中字母的升序或降序進行排序。
8.一種利用權利要求1-7中任一項所述的方法在word文檔中提取英文縮略語的系統,其特征在于,包括:
交互模塊,用于提示用戶輸入需提取英文縮略語的word文檔的文件名稱,并用于接收和發送所述word文檔的文件名稱,同時還用于在過濾文件中錄入非縮略語單詞;
讀取模塊,用于接收所述word文檔的文件名稱,并用于讀取所述word文檔,以及獲取所述word文檔中的全部語句;
分析模塊,用于生成所述精選縮略語列表,并用于對所述精選縮略語列表中的單詞進行排序;
Excel寫入模塊,用于生成Excel表格,并將排序后的所述精選縮略語列表中的單詞寫入Excel表格內保護;
邏輯控制模塊,用于調用和控制所述交互模塊、讀取模塊、分析模塊和Excel寫入模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市吉祥騰達科技有限公司,未經深圳市吉祥騰達科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210072746.8/1.html,轉載請聲明來源鉆瓜專利網。





