[發明專利]輿情分析方法、裝置、計算機裝置及存儲介質有效
| 申請號: | 201910989748.1 | 申請日: | 2019-10-17 |
| 公開(公告)號: | CN110929145B | 公開(公告)日: | 2023-07-21 |
| 發明(設計)人: | 楊冬艷 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 劉麗華 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輿情 分析 方法 裝置 計算機 存儲 介質 | ||
1.一種輿情分析方法,其特征在于,所述方法包括:
提取多個用戶中的每個用戶第一時間段內在網絡中發布的第一輿情數據;
對所述每個用戶的第一輿情數據進行聚類,得到所述每個用戶的第一主題詞;
根據所述第一主題詞對所述多個用戶進行劃分,得到所述第一時間段內的多個第一用戶簇和每個第一用戶簇對應的第一輿情主題,包括:根據所述第一主題詞以所述多個用戶為節點構建第一輿情網絡,根據所述第一輿情網絡計算所述每個用戶的密度值,根據所述每個用戶的密度值確定第一用戶簇中心點,得到所述第一用戶簇中心點對應的第一用戶簇,將所述多個用戶中與所述第一用戶簇中心點相距預設跳數內的用戶加入所述第一用戶簇,根據所述第一用戶簇的第一主題詞生成所述第一用戶簇對應的第一輿情主題,其中,所述根據所述第一主題詞以所述多個用戶為節點構建第一輿情網絡,包括:連接所述多個用戶中有相同的第一主題詞的兩個用戶,根據相連接的兩個用戶之間相同的第一主題詞的數量確定該相連接的兩個用戶之間的權值;
提取所述每個用戶第二時間段內在網絡中發布的第二輿情數據;
對所述每個用戶的第二輿情數據進行聚類,得到所述每個用戶的第二主題詞;
根據所述第二主題詞對所述多個用戶進行劃分,得到所述第二時間段內的多個第二用戶簇和每個第二用戶簇對應的第二輿情主題;
確定所述第一輿情主題和所述第二輿情主題中相同的輿情主題,根據所述相同的輿情主題對應的第一用戶簇和第二用戶簇確定所述相同的輿情主題的演化階段,所述演化階段包括上升階段、停滯階段和下降階段。
2.如權利要求1所述的方法,其特征在于,所述對所述每個用戶的第一輿情數據進行聚類,得到所述每個用戶的第一主題詞包括:
采用向量空間模型表示所述第一輿情數據,將所述第一輿情數據中的每個文本用所述向量空間模型中的一個文本向量表示,將所述第一輿情數據的每個文本向量作為一個簇;
循環執行計算所述第一輿情數據的每兩個簇之間的相似度,將相似度最大的兩個簇合并為一個新的簇,直至所述第一輿情數據的簇的數量達到預設數量;
從所述第一輿情數據的簇中提取所述第一主題詞。
3.如權利要求2所述的方法,其特征在于,所述采用向量空間模型表示所述第一輿情數據,將所述第一輿情數據中的每個文本用所述向量空間模型中的一個文本向量表示包括:
對所述每個用戶的第一輿情數據進行停用詞過濾處理、分詞處理,得到所述每個用戶的第一輿情數據包含的不同的詞條;
將所述多個用戶中所有用戶的第一輿情數據包含的所有不同的詞條作為所述向量空間模型中不同的正交維度,根據所述每個用戶的第一輿情數據中的每個文本包含的不同的詞條計算所述每個文本在每個正交維度的坐標值,得到所述每個文本對應的文本向量;
基于所述多個用戶中所有用戶的第一輿情數據包含的所有不同的詞條的信息增益縮減所述向量空間模型的維度。
4.如權利要求2所述的方法,其特征在于,所述計算所述第一輿情數據的每兩個簇之間的相似度包括:
若兩個簇中的每個簇只包括一個文本向量,兩個簇之間的相似度為兩個簇中的兩個文本向量之間的離差平方和的倒數或兩個簇中的兩個文本向量之間的歐式距離的倒數;
若兩個簇中的每個簇包括兩個或兩個以上文本向量,兩個簇之間的相似度為兩個簇之間的離差平方和的倒數或兩個簇的質心之間的歐式距離的倒數。
5.如權利要求2所述的方法,其特征在于,所述從所述第一輿情數據的簇中提取所述第一主題詞包括:
從所述第一輿情數據的文本向量最多的簇中提取信息增益最大的詞條作為所述第一主題詞;或者
從所述第一輿情數據的文本向量最多的簇中提取信息增益大于預設增益閾值的詞條作為所述第一主題詞;或者
從所述第一輿情數據的離差平方和最小的簇中提取權重最大的詞條作為所述第一主題詞;或者
從所述第一輿情數據的離差平方和小于預設離差平方和的每個簇中提取權重最大的詞條作為所述第一主題詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910989748.1/1.html,轉載請聲明來源鉆瓜專利網。





