[發明專利]輿情分析方法、裝置、計算機裝置及存儲介質有效
| 申請號: | 201910989748.1 | 申請日: | 2019-10-17 |
| 公開(公告)號: | CN110929145B | 公開(公告)日: | 2023-07-21 |
| 發明(設計)人: | 楊冬艷 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 劉麗華 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輿情 分析 方法 裝置 計算機 存儲 介質 | ||
本發明提供一種輿情分析方法、裝置、計算機裝置及存儲介質。所述方法包括:提取每個用戶第一時間段內在網絡中發布的第一輿情數據;對每個用戶的第一輿情數據進行聚類,得到每個用戶的第一主題詞;根據第一主題詞得到第一時間段內的第一用戶簇及第一輿情主題;提取每個用戶第二時間段內在網絡中發布的第二輿情數據;對每個用戶的第二輿情數據進行聚類,得到每個用戶的第二主題詞;根據第二主題詞得到第二時間段內的第二用戶簇及第二輿情主題;確定所述第一輿情主題和所述第二輿情主題中相同的輿情主題,確定所述相同的輿情主題的演化階段。本發明能夠根據不同時間段的輿情數據確定輿情的演化階段。
技術領域
本發明涉及互聯網輿情技術領域,具體涉及一種輿情分析方法、裝置、計算機裝置及計算機存儲介質。
背景技術
隨著互聯網的普及,互聯網日漸成為人們發布信息、獲取信息和傳遞信息的主要載體,一定程度地反映了社會公眾對社會現實的主觀情感,即輿情。輿情數據對及時了解民意、反映社會信息、控制引導輿論正確的發展、社會穩定和國家發展至關重要。對輿情進行分析有助于了解事件的發展態勢,避免事件的惡性蔓延,為輿情事件應急管理提供重要的決策支持。輿情的演化階段是針對輿情采取應對措施的一個重要依據。然而,現有的輿情分析方法主要是對某一時間段內的輿情熱點進行分析,缺少對輿情演化階段的分析,也就是不能確定輿情的演化階段。
發明內容
鑒于以上內容,有必要提出一種輿情分析方法、裝置、計算機裝置及計算機存儲介質,其可以確定輿情的演化階段,為針對輿情采取應對措施提供了重要依據。
本申請的第一方面提供一種輿情分析方法,所述方法包括:
提取多個用戶中的每個用戶第一時間段內在網絡中發布的第一輿情數據;
對所述每個用戶的第一輿情數據進行聚類,得到所述每個用戶的第一主題詞;
根據所述第一主題詞對所述多個用戶進行劃分,得到所述第一時間段內的多個第一用戶簇和每個第一用戶簇對應的第一輿情主題;
提取所述每個用戶第二時間段內在網絡中發布的第二輿情數據;
對所述每個用戶的第二輿情數據進行聚類,得到所述每個用戶的第二主題詞;
根據所述第二主題詞對所述多個用戶進行劃分,得到所述第二時間段內的多個第二用戶簇和每個第二用戶簇對應的第二輿情主題;
確定所述第一輿情主題和所述第二輿情主題中相同的輿情主題,根據所述相同的輿情主題對應的第一用戶簇和第二用戶簇確定所述相同的輿情主題的演化階段。
另一種可能的實現方式中,所述對所述每個用戶的第一輿情數據進行聚類,得到所述每個用戶的第一主題詞包括:
采用向量空間模型表示所述第一輿情數據,將所述第一輿情數據中的每個文本用所述向量空間模型中的一個文本向量表示,將所述第一輿情數據的每個文本向量作為一個簇;
循環執行計算所述第一輿情數據的每兩個簇之間的相似度,將相似度最大的兩個簇合并為一個新的簇,直至所述第一輿情數據的簇的數量達到預設數量;
從所述第一輿情數據的簇中提取所述第一主題詞。
另一種可能的實現方式中,所述采用向量空間模型表示所述第一輿情數據,將所述第一輿情數據中的每個文本用所述向量空間模型中的一個文本向量表示包括:
對所述每個用戶的第一輿情數據進行停用詞過濾處理、分詞處理,得到所述每個用戶的第一輿情數據包含的不同的詞條;
將所述多個用戶中所有用戶的第一輿情數據包含的所有不同的詞條作為所述向量空間中不同的正交維度,根據所述每個用戶的第一輿情數據中的每個文本包含的不同的詞條計算所述每個文本在每個正交維度的坐標值,得到所述每個文本對應的文本向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910989748.1/2.html,轉載請聲明來源鉆瓜專利網。





