[發明專利]一種從英文文獻正文中提取地理位置的軟件系統及方法在審
| 申請號: | 202111314603.5 | 申請日: | 2021-11-08 |
| 公開(公告)號: | CN114036906A | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 李娜;楊濟鳴;馬管;劉啟政 | 申請(專利權)人: | 中國科學院西北生態環境資源研究院 |
| 主分類號: | G06F40/166 | 分類號: | G06F40/166;G06F16/29;G06F16/25 |
| 代理公司: | 溫州市品創專利商標代理事務所(普通合伙) 33247 | 代理人: | 吳海云 |
| 地址: | 730000 甘*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 英文 文獻 文中 提取 地理位置 軟件 系統 方法 | ||
1.一種從英文文獻正文中提取地理位置的軟件系統,其特征在于,包括:
打開文件模塊,用于打開英文文獻文件;
導入EXCEL信息模塊,用于打開EXCEL表格,插入數據庫信息;
查詢地理位置模塊,用于增加地理位置信息、查詢信息、修改信息;
提取地理位置模塊,用于提取地理位置信息;
軟件說明模塊,用于說明軟件的應用詳情和軟件的使用說明。
2.根據權利要求1所述的從英文文獻正文中提取地理位置的軟件系統,其特征在于,所述導入EXCEL信息模塊包括打開表格單元和插入數據庫單元,所述打開表格單元用于打開EXCEL表格,插入數據庫單元用于插入數據庫信息。
3.根據權利要求2所述的從英文文獻正文中提取地理位置的軟件系統,其特征在于,所述插入數據庫單元包括提取單元和自定義提取單元,所述提取單元用于根據軟件中已經提供的正則表達式,對文字進行匹配提取,所述自定義提取單元用于自定義提取單元用于對原軟件功能進行補充,補充軟件中正則表達式的不完整。
4.根據權利要求1所述的從英文文獻正文中提取地理位置的軟件系統,其特征在于,所述查詢地理位置模塊包括增加地理位置信息單元、查詢地理位置信息單元及修改地理位置信息單元;
所述增加地理位置信息單元用于對調取出的數據進行審閱,如果不詳細或者不全,進行補全和添加備注地理位置,最后保存入數據庫;
所述查詢地理位置信息單元用于調取數據庫,逐條展示所有提取出的數據和匹配的地理位置信息;
所述修改地理位置信息單元用于對調取出的地理位置信息進行審閱,如果有需要修改的可以在操作界面進行修改,進行保存,如果有錯誤,不保存即可。
5.根據權利要求1所述的從英文文獻正文中提取地理位置的軟件系統,其特征在于,所述軟件說明模塊包括應用詳情單元和使用說明單元,詳情單元用于說明軟件的應用詳情,使用說明單元用于說明軟件的使用詳情。
6.一種從英文文獻正文中提取地理位置的方法,其特征在于,包括:
首先需要對少部分論文中的地理位置進行人工提取,之后分析獲得的大部分地理位置的總體特征,將他們依次寫作正則表達式;正則表達式是由普通字符以及特殊字符組成的文字模式;
特殊字符是一些有特殊含義的字符就是表示任何字符串的意思;如果要查找文件名中有*的文件,則需要對*進行轉義,許多元字符要求在試圖匹配它們時特別對待;
若要匹配這些特殊字符,首先使字符轉義,即將反斜杠字符(\)放在它們前面;根據對大量文獻中地理位置信息和參考文獻出現的位置,將文章分為兩種情況,一種是標明參考文獻位置的文章,選擇使用正則的方法截取前面部分文獻;另一種沒有注明參考文獻的文獻,選擇按照百分比進行截取,能夠起到類似的效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院西北生態環境資源研究院,未經中國科學院西北生態環境資源研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111314603.5/1.html,轉載請聲明來源鉆瓜專利網。





