[發明專利]一種從英文文獻正文中提取地理位置的軟件系統及方法在審
| 申請號: | 202111314603.5 | 申請日: | 2021-11-08 |
| 公開(公告)號: | CN114036906A | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 李娜;楊濟鳴;馬管;劉啟政 | 申請(專利權)人: | 中國科學院西北生態環境資源研究院 |
| 主分類號: | G06F40/166 | 分類號: | G06F40/166;G06F16/29;G06F16/25 |
| 代理公司: | 溫州市品創專利商標代理事務所(普通合伙) 33247 | 代理人: | 吳海云 |
| 地址: | 730000 甘*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 英文 文獻 文中 提取 地理位置 軟件 系統 方法 | ||
本發明公開了一種從英文文獻正文中提取地理位置的軟件系統及方法,其中的軟件系統包括:打開文件模塊,用于打開英文文獻文件;導入EXCEL信息模塊,用于打開EXCEL表格,插入數據庫信息;查詢地理位置模塊,用于增加地理位置信息、查詢信息、修改信息;提取地理位置模塊,用于提取地理位置信息;軟件說明模塊,用于說明軟件的應用詳情和軟件的使用說明。本發明的軟件系統預留了臨時添加地理位置特征的功能,也可以在源代碼的基礎上二次開發,能夠快速尋找出相對應的地理位置信息。同時可以自由選擇是批量提取或者進行單次提取。
技術領域
本發明涉及英文文獻提取技術,具體涉及一種從英文文獻正文中提取地理位置的軟件系統及方法。
背景技術
目前,隨著地學文獻的逐步增加,面對大量的文獻研究人員不知道從何下手,我們對文章研究時常常需要文章的研究區域與地理信息,但是如果對每一篇文章單獨去尋找,則會極大地消耗時間與精力。
面對成百上千篇含有不同格式地理位置信息的文獻,如果要提取地理位置信息,每篇文章需要熟讀,而大部分文章除了地理位置,并無閱讀需求,需要耗費大量不有必要時間。
其次,需要對文獻進行準確的分段,直接下載的英文文獻中由于有參考文獻部分,對文獻在論文題目庫中進行匹配時會產生誤導作用,而每篇文章的長度不同,很難準確截取。
最后的問題為數據的保存方法,因為需要保證數據的隨時可重新使用,而無需重新匹配進行工作。
當前正則表達式被廣泛使用,C#編程語言在Windows平臺有著很好的兼容性。
但是面對當前地學領域的應用場景,很難找到定位準確的軟件,即能夠實現準確識別當前地學領域中英文文獻中地理位置信息功能的軟件。
因此,有使用的必要來開發該軟件。
發明內容
本發明的主要目的在于提供一種從英文文獻正文中提取地理位置的軟件系統及方法。
根據本發明的一個方面,提供了一種從英文文獻正文中提取地理位置的軟件系統,包括:
打開文件模塊,用于打開英文文獻文件;
導入EXCEL信息模塊,用于打開EXCEL表格,插入數據庫信息;
查詢地理位置模塊,用于增加地理位置信息、查詢信息、修改信息;
提取地理位置模塊,用于提取地理位置信息;
軟件說明模塊,用于說明軟件的應用詳情和軟件的使用說明。
進一步地,所述導入EXCEL信息模塊包括打開表格單元和插入數據庫單元,所述打開表格單元用于打開EXCEL表格,插入數據庫單元用于插入數據庫信息。
更進一步地,所述插入數據庫單元包括提取單元和自定義提取單元,所述提取單元用于根據軟件中已經提供的正則表達式,對文字進行匹配提取,所述自定義提取單元用于自定義提取單元用于對原軟件功能進行補充,補充軟件中正則表達式的不完整。
更進一步地,所述查詢地理位置模塊包括增加地理位置信息單元、查詢地理位置信息單元及修改地理位置信息單元;
所述增加地理位置信息單元用于對調取出的數據進行審閱,如果不詳細或者不全,進行補全和添加備注地理位置,最后保存入數據庫;
所述查詢地理位置信息單元用于調取數據庫,逐條展示所有提取出的數據和匹配的地理位置信息;
所述修改地理位置信息單元用于對調取出的地理位置信息進行審閱,如果有需要修改的可以在操作界面進行修改,進行保存,如果有錯誤,不保存即可。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院西北生態環境資源研究院,未經中國科學院西北生態環境資源研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111314603.5/2.html,轉載請聲明來源鉆瓜專利網。





