[發明專利]網絡輿情分析方法、裝置及存儲介質有效
| 申請號: | 201810998132.6 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109325165B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 李溫鍵;盛瑞生;高巍華;張兆軼;苑利慧;陸柏含 | 申請(專利權)人: | 中國平安保險(集團)股份有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/35;G06F40/284 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區益田路5033*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 輿情 分析 方法 裝置 存儲 介質 | ||
1.一種網絡輿情分析方法,應用于電子裝置,其特征在于,該方法包括:
通過網絡爬蟲從預設的數據渠道采集與第一預設關鍵詞相關的輿情文章,對所述輿情文章進行分詞處理,得到每篇輿情文章對應的詞匯集合;
分別將每篇輿情文章對應的詞匯集合與多個第二預設關鍵詞進行匹配,根據匹配結果為每篇輿情文章標注與第二預設關鍵詞對應的第一標簽,所述第一標簽為表征輿情文章涉及的專業公司的分類標簽;
根據預設分析規則,計算所述輿情文章的情感得分,判斷所述輿情文章的情感傾向,并為所述輿情文章標注第二標簽;
根據所述第一標簽,統計每個第一標簽對應的輿情文章的總數,根據所述第二標簽,統計每個第一標簽對應負面輿情文章的數量;及
分別計算每個第一標簽對應的負面輿情影響力及總輿情影響力,并計算每個第一標簽的輿情健康度,包括:分別獲取所述多個第一標簽對應的每篇輿情文章的發布媒體信息,根據發布媒體信息確定每個第一標簽對應的每篇輿情文章對應的媒體權重指數及媒體級別指數,根據每個第一標簽對應的負面輿情文章的媒體權重指數及媒體級別指數,計算每個第一標簽對應的負面輿情文章的負面輿情影響力,根據每個第一標簽對應的輿情文章的媒體權重指數及媒體級別指數,計算每個第一標簽對應的輿情文章的總輿情影響力,所述負面輿情影響力的計算公式為:
其中,INo表示第一標簽p對應的M1p篇負面輿情文章的負面輿情影響力,αi表示第一標簽p對應的不同負面輿情文章i的媒體權重指數,βi表示第一標簽p對應的不同負面輿情文章i的的媒體級別指數;所述總輿情影響力的計算公式為:
其中,ITp表示第一標簽p對應的M2p篇輿情文章的總輿情影響力,αi表示第一標簽p對應的不同輿情文章i的媒體權重指數,βi表示第一標簽p對應的不同輿情文章i的的媒體級別指數;所述輿情健康度的計算公式為:
H=(1-INp/ITp)*10,
其中,INp表示第一標簽p對應的M1p篇負面輿情文章的負面輿情影響力,ITp表示第一標簽p對應的M2p篇輿情文章的總輿情影響力。
2.如權利要求1所述的網絡輿情分析方法,其特征在于,所述“根據預設分析規則,計算所述輿情文章的情感得分,判斷所述輿情文章的情感傾向”的步驟包括:
采用聚類算法對所述輿情文章進行聚類分析,生成多個觀點主題,根據觀點主題包含的輿情文章的詞向量計算觀點主題的詞向量;及
將觀點主題的詞向量輸入到預先訓練好的情感評分模型中,輸出觀點主題的情感得分;及
根據情感得分確定觀點主題對應的輿情文章所屬的情感傾向。
3.如權利要求1至2中任意一項所述的網絡輿情分析方法,其特征在于,該方法還包括:
按照每個第一標簽的輿情健康度的高低順序,對所述多個第一標簽進行排序;及
篩選出預設數量的輿情健康度較低的第一標簽,并根據該預設數量的第一標簽及輿情健康度生成預警信息并輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安保險(集團)股份有限公司,未經中國平安保險(集團)股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810998132.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種公共區域的服務推薦方法和系統
- 下一篇:爬蟲系統中解析規則配置方法及裝置





