[發明專利]一種基于爬蟲和文本聚類分析的網絡輿情分析系統在審
| 申請號: | 201610885652.7 | 申請日: | 2016-10-10 |
| 公開(公告)號: | CN106649498A | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 曹衛星 | 申請(專利權)人: | 合肥紅珊瑚軟件服務有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京和信華成知識產權代理事務所(普通合伙)11390 | 代理人: | 胡劍輝 |
| 地址: | 232000 安徽省合肥市高新*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 爬蟲 文本 聚類分析 網絡 輿情 分析 系統 | ||
1.一種基于爬蟲和文本聚類分析的網絡輿情分析系統,其特征在于,包括支撐層、數據層、服務層、功能層;
所述的功能層包括網頁信息采集模塊、數據預處理模塊、信息檢索模塊、檢索信息分析模塊、歸檔管理模塊、興趣點數據統計模塊、系統管理模塊;
所述的網頁信息采集模塊利用網絡爬蟲技術抓取特定領域的網頁信息,存儲到本地數據庫中,并根據指定的更新策略對網頁信息進行更新;
所述的數據預處理模塊負責對采集到的網絡文本數據進行標題、統一資源定位符、時間、網頁內容等特征的提?。?/p>
所述的信息檢索模塊負責對網頁信息的全文檢索和個性化檢索,包括單個關鍵詞和綜合用戶背景的個性化搜索;
所述的網頁信息分析與挖掘模塊主要用于對網頁信息的歸類、文本聚類、傾向性分析、熱點話題檢測處理,并形成檢索分析與挖掘研究報告;
所述的歸檔管理模塊用于對檢索的重要信息進行歸類整理,對重要的檢索信息進行歸檔操作,便于后續的查詢;
所述的興趣點數據統計模塊負責對用戶感興趣的熱點話題、專題報道、類別信息等進行時間、空間的統計;
所述的系統管理模塊提供用戶管理、權限管理以及日志管理功能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥紅珊瑚軟件服務有限公司,未經合肥紅珊瑚軟件服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610885652.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網頁展示方法及裝置
- 下一篇:沙發套件(時尚真皮沙發)





