[發明專利]輿情分析方法及相關產品在審
| 申請號: | 202210052820.X | 申請日: | 2022-01-18 |
| 公開(公告)號: | CN114491207A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 趙樂 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F40/30;G06F16/35;G06N3/02 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 陳倩倩 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輿情 分析 方法 相關 產品 | ||
1.一種輿情分析方法,其特征在于,所述方法應用于輿情分析系統,所述輿情分析系統包括:數據處理裝置、消息隊列、第一流計算引擎、第一服務器、第二流計算引擎、第二服務器以及搜索引擎,所述第一服務器維護第一數據庫,所述第二服務器維護第二數據庫;所述方法包括:
通過所述數據處理裝置爬取多個網頁數據;
通過所述數據處理裝置將所述多個網頁數據發布到所述消息隊列;
通過所述第一服務器從所述消息隊列中消費所述多個網頁數據中的第一部分網頁數據,并將所述第一部分網頁數據離線存儲到所述第一數據庫;
通過所述第一流計算引擎從所述消息隊列中消費所述多個網頁數據中的第二部分網頁數據,對所述第二部分網頁數據進行輿情分析,得到所述第二部分網頁數據的輿情分析結果,并將所述第二部分網頁數據的輿情分析結果存儲到所述第二數據庫;
通過所述第二流計算引擎從所述第一數據庫中獲取所述第一部分網頁數據,并對所述第一部分網頁數據進行輿情分析,得到所述第一部分網頁數據的輿情分析結果,并將所述第一部分網頁數據的輿情分析結果存儲到所述第二數據庫;
通過所述第二服務器對所述第一部分網頁數據的輿情分析結果,以及所述第二部分網頁數據的輿情分析結果進行整合,得到所述多個網頁數據的輿情分析結果,并將所述多個網頁數據的輿情分析結果同步到所述搜索引擎。
2.根據權利要求1所述的方法,其特征在于,所述將所述多個網頁數據發布到消息隊列,包括:
對所述多個網頁數據中的每個所述網頁數據進行輿情評分,得到每個所述網頁數據的輿情評分,其中,每個所述網頁數據的輿情評分用于表征每個所述網頁數據的處理優先級;
將所述多個網頁數據中的所述第一部分網頁數據發送到所述Kafak隊列中的第一預設主題,其中,所述第一部分網頁數據中的任意一個網頁數據的輿情評分小于評分閾值;
將所述多個網頁數據中的所述第二部分網頁數據發送到所述Kafak隊列中的第二預設主題,其中,所述第二部分網頁數據中的任意一個網頁數據的輿情評分大于或等于所述評分閾值;
所述從所述消息隊列中消費多個網頁數據中的第一部分網頁數據,包括:
從所述第一預設主題中消費所述第一部分網頁數據;
所述從消息隊列中消費所述多個網頁數據中的第二部分網頁數據,包括:
從所述第二預設主題中消費所述第二部分網頁數據。
3.根據權利要求2所述的方法,其特征在于,所述對所述多個網頁數據中的每個所述網頁數據進行輿情評分,得到每個所述網頁數據的輿情評分,包括:
對所述多個網頁數據進行聚類,得到K個第一網頁數據組,其中,每個所述第一網頁數據組對應同一個輿情事件,每個所述第一網頁數據組包括所述多個網頁數據中的一個或多個;
對每個所述第一網頁數據組中的多個網頁數據進行聚類,得到與每個所述第一網頁數據組對應的L個第二網頁數據組,其中,每個所述第二網頁數據組包括一個原創網頁數據以及與所述原創網頁數據對應的H個轉載網頁數據;
根據每個所述第二網頁數據組包括的一個原創網頁數據以及H個轉載網頁數據,確定每個所述第一網頁數據組對應的輿情事件的輿情評分;
根據每個所述第一網頁數據組對應的輿情事件的輿情評分,確定所述多個網頁數據中的每個所述網頁數據的輿情評分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210052820.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:動態跟蹤軌交司機狀態的方法和裝置
- 下一篇:建筑物頂面造型識別方法及裝置





