[發(fā)明專利]一種技術文獻信息提取方法、系統(tǒng)及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202111086474.9 | 申請日: | 2021-09-16 |
| 公開(公告)號: | CN113722472B | 公開(公告)日: | 2022-09-09 |
| 發(fā)明(設計)人: | 熊蕊 | 申請(專利權(quán))人: | 北京市科學技術研究院 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F16/36;G06F16/383 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 趙興華 |
| 地址: | 100089 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 技術 文獻 信息 提取 方法 系統(tǒng) 存儲 介質(zhì) | ||
1.一種技術文獻信息提取方法,其特征在于,所述方法包括:
根據(jù)用戶輸入的檢索文本,在文獻檢索網(wǎng)站上檢索得到與檢索文本對應的若干條技術文獻信息;
對所述若干條技術文獻信息進行預處理,得到技術信息匯總列表;
根據(jù)所述技術信息匯總列表,生成綜合圖表數(shù)據(jù)集;
根據(jù)用戶選擇輸入的內(nèi)容,生成對應的特定圖表數(shù)據(jù)集進行顯示;
所述綜合圖表數(shù)據(jù)集和特定圖表數(shù)據(jù)集包括以數(shù)據(jù)表格和可視化圖譜形式展現(xiàn)的圖表數(shù)據(jù);
所述對所述若干條技術文獻信息進行預處理具體包括:
將若干條技術文獻信息以列表文件形式導出,得到若干個文獻列表;其中,在所述文獻列表文件中,除表頭以外每行內(nèi)容對應一條技術文獻信息;
遍歷所述若干個文獻列表,并將第i個文獻列表中的技術文獻信息導入第1個文獻列表中,得到初始文獻列表;其中,1iI,I為文獻列表文件的數(shù)量;
刪除所述初始文獻列表中重復的技術文獻信息,得到去重文獻列表;
對所述去重文獻列表的表頭進行規(guī)范化處理,得到技術信息匯總列表;
根據(jù)用戶選擇輸入的內(nèi)容,生成對應的特定圖表數(shù)據(jù)集,便于技術人員對感興趣的特定方向進行研究,具體包括:
所述特定圖表數(shù)據(jù)集包括研究學者發(fā)文列表、研究學者歷年發(fā)文情況直方圖、研究機構(gòu)發(fā)文列表、研究機構(gòu)歷年發(fā)文情況直方圖、研究機構(gòu)演化列表、研究關鍵詞文獻列表和研究關鍵詞歷年發(fā)文情況直方圖;
判斷用戶選擇輸入的內(nèi)容為研究學者名稱時,遍歷所述技術信息匯總列表,生成研究學者發(fā)文列表以及研究學者歷年發(fā)文情況直方圖;
判斷用戶選擇輸入的內(nèi)容為研究機構(gòu)名稱時,遍歷所述技術信息匯總列表,生成研究機構(gòu)發(fā)文列表、研究機構(gòu)歷年發(fā)文情況直方圖以及研究機構(gòu)演化列表;
判斷用戶選擇輸入的內(nèi)容為研究關鍵詞時,遍歷所述技術信息匯總列表,生成研究關鍵詞文獻列表以及研究關鍵詞歷年發(fā)文情況直方圖。
2.根據(jù)權(quán)利要求1所述的技術文獻信息提取方法,其特征在于,所述對去重文獻列表的表頭進行規(guī)范化處理具體包括:
識別出所述去重文獻列表表頭中表示研究學者的列、表示研究機構(gòu)的列、表示研究關鍵詞的列和表示發(fā)文年份的列;所述表示研究學者的列的列名中包括字符串“作者”或“學者”,所述表示研究機構(gòu)的列的列名中包括字符串“機構(gòu)”或“單位”,所述表示研究關鍵詞的列的列名中包括字符串“關鍵詞”或“關鍵字”,所述表示發(fā)文年份的列的列名中包括字符串“年”或“年份”;
如果列名不為中文的先將列名翻譯成中文后再進行判斷;
使用字符串“研究學者”替換去重文獻列表表頭中表示研究學者的列名,使用字符串“研究機構(gòu)”替換去重文獻列表表頭中表示研究機構(gòu)的列名,使用字符串“研究關鍵詞”替換去重文獻列表表頭中表示研究關鍵詞的列名,使用字符串“發(fā)文年份”替換去重文獻列表表頭中表示發(fā)文年份的列名。
3.根據(jù)權(quán)利要求2所述的技術文獻信息提取方法,其特征在于,所述根據(jù)所述技術信息匯總列表生成綜合圖表數(shù)據(jù)集具體包括:
在所述技術信息匯總列表中,分別識別并提取研究學者、研究機構(gòu)和研究關鍵詞,得到研究學者列表、研究機構(gòu)列表和研究關鍵詞列表;
根據(jù)所述技術信息匯總列表分別對所述研究學者列表、所述研究機構(gòu)列表和所述研究關鍵詞列表進行擴展,得到對應的研究學者信息列表、研究機構(gòu)信息列表和研究關鍵詞信息列表;
按照發(fā)文年份,對所述技術信息匯總列表中的技術文獻信息進行排序,并按照發(fā)文年份生成歷年發(fā)文數(shù)量的直方圖、歷年研究學者數(shù)量的直方圖和歷年研究機構(gòu)數(shù)量的直方圖;
分別遍歷所述技術信息匯總列表中的研究學者單元格、研究機構(gòu)單元格和研究關鍵詞單元格,生成對應的研究學者關系圖、研究機構(gòu)關系圖和研究關鍵詞關系圖。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京市科學技術研究院,未經(jīng)北京市科學技術研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111086474.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





