[發明專利]一種基于海量文獻信息的可視化分析系統及其方法在審
| 申請號: | 201711411611.5 | 申請日: | 2017-12-23 |
| 公開(公告)號: | CN108170761A | 公開(公告)日: | 2018-06-15 |
| 發明(設計)人: | 虞揚 | 申請(專利權)人: | 合肥彈剛信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京和信華成知識產權代理事務所(普通合伙) 11390 | 代理人: | 胡劍輝 |
| 地址: | 230000 安徽省合肥市經濟技*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文獻信息 可視化 數據臨時存儲 可視化分析系統 數據處理模塊 數據獲取模塊 分析數據庫 關聯度分析 分析 掃描 分類和標記 輸入關鍵詞 查詢 標記單元 參考依據 分類單元 分析模塊 用戶輸出 用戶提供 存儲 采集 決策 | ||
本發明公開一種基于海量文獻信息的可視化分析系統,包括數據獲取模塊、數據臨時存儲庫、數據處理模塊、可視化分析數據庫和可視化分析模塊;數據獲取模塊包括爬取單元、分類單元以及查詢標記單元;數據臨時存儲庫用于存儲經查詢、標記后的文獻信息;數據處理模塊用于將數據臨時存儲庫中的文獻信息進行掃描,并對掃描后的文獻信息進行處理、分析;可視化分析數據庫根據關聯度分析的結果進行可視化分析,為用戶輸出可視化分析結果。本發明通過對海量文獻信息進行采集、分類和標記,并將文獻信息中的關鍵詞與輸入關鍵詞進行關聯度分析,為可視化分析提供可靠的參考依據,便于對海量文獻信息進行有效的整理,實現可視化分析,為用戶提供決策。
技術領域
本發明屬于軟件開發開發領域,涉及到一種基于海量文獻信息的可視化分析系統及其方法。
背景技術
隨著信息技術的發展,每個行業都面臨著海量數據的問題,人們不僅僅是對數據進行管理,還要從大量的數據里面獲得全面的知識和信息,以便對數據進行分析。隨著學術研究的蓬勃發展,文獻資料數量也越來越大,對于文獻數據分析的需求也日益凸顯,對于海量科技文獻信息的分析,可以幫助用戶了解目前熱門學科,各領域研究的主要人員和各領域發展動態等等。
但是目前對文獻分析的工作通過多個角度進行分析,而分析的結果通常采用表格、圖表或其他方式進行展示,由于科學文獻網絡是復雜的異構數據信息,且信息量大,而現有的分析手段無法對海量的文獻信息進行可視化分析,進而導致無法為用戶提供直觀、可靠的參考依據,且無法實現可視化展示效果。
發明內容
本發明的目的在于提供一種基于海量文獻信息的可視化分析系統及其方法,解決了現有分析手段無法對海量文獻信息進行可視化分析,進而導致無法為用戶提供可靠的參考依據和進行可視化展示效果的問題。
本發明的目的可以通過以下技術方案實現:
一種基于海量文獻信息的可視化分析系統,包括數據獲取模塊、數據臨時存儲庫、數據處理模塊和可視化分析數據庫;
所述數據獲取模塊包括爬取單元、分類單元以及查詢標記單元,爬取單元用于對數據源中的海量文獻信息進行采集,并將采集的海量文獻信息發送至分類單元;
所述分類單元用于對采集的海量文獻信息按照行業類別的不同進行劃分;
所述查詢標記單元用于輸入關鍵詞對文獻信息進行查詢,并對查詢后的文獻信息進行標記;
所述數據臨時存儲庫用于存儲經查詢、標記后的文獻信息;
所述數據處理模塊用于將數據臨時存儲庫中的文獻信息進行掃描,并對掃描后的文獻信息進行處理、分析;
所述可視化分析數據庫用于存儲數據處理模塊分析后的文獻信息,根據關聯度分析的結果進行可視化分析,為用戶輸出可視化分析結果。
進一步地,所述數據處理模塊包括信息掃描單元、數據預處理單元和關聯度分析單元;
所述信息掃描單元用于讀取數據臨時存儲庫中的文獻信息;
所述數據預處理單元用于對讀取的文獻信息中的內容進行數據清洗,以提取文獻中的關鍵詞;
所述關聯度分析單元用于將提取的關鍵詞與輸入的關鍵詞進行關聯度分析。
一種基于海量文獻信息的可視化分析方法,包括以下步驟:
S1、對數據源中的海量文獻信息進行采集,并將采集的海量文獻信息按照領域不同劃分為若干行業類別,并提取行業類別中文獻信息的關鍵詞;
S2、在行業類別中輸入若干關鍵詞對海量文獻信息進行查詢,對查詢的結果進行標記,并將標記后的文獻信息存儲至數據臨時存儲庫;
S3、對數據臨時存儲庫中的文獻信息進行掃描,并將掃描后的結果發送至數據預處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥彈剛信息科技有限公司,未經合肥彈剛信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711411611.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能硬件管理系統和設備
- 下一篇:基于Kinect的圖像檢索方法





