[發明專利]網絡輿情的分析方法、裝置及計算機可讀存儲介質在審
| 申請號: | 201810544762.6 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN108959383A | 公開(公告)日: | 2018-12-07 |
| 發明(設計)人: | 吳壯偉 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06K9/62 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞匯集合 網絡輿情 計算機可讀存儲介質 熱度 預處理 采集 分析裝置 聚類分析 聚類算法 評分模型 預警能力 預警信息 詞向量 話題 預設 判定 分析 輸出 監控 | ||
本發明公開了一種網絡輿情的分析方法,該方法包括:確定輿情事件,采集與輿情事件相關的輿情文章;對采集的輿情文章進行預處理,獲取輿情文章中的詞匯集合以表征輿情文章;采用聚類算法對詞匯集合進行聚類分析,生成輿情事件的多個觀點,計算觀點的詞向量;從觀點包含的詞匯集合中提取核心話題;通過情感評分模型計算觀點的情感得分,并計算觀點的熱度;根據情感得分和熱度計算觀點的輿情指數,并判定輿情指數的絕對值大于預設閾值的觀點為異常觀點,根據異常觀點及其核心話題生成預警信息并輸出。本發明還提出一種網絡輿情的分析裝置以及一種計算機可讀存儲介質。本發明提高了對輿情的監控和預警能力。
技術領域
本發明涉及計算機技術領域,尤其涉及一種網絡輿情的分析方法、裝置及計算機可讀存儲介質。
背景技術
網絡輿情是指在網絡上流行的對社會事件不同看法的網絡輿論,是社會輿論的一種表現形式。主要是以網絡為載體,以事件為核心,公眾對該事件的情感、態度、意見、觀點的表達、傳播與互動,以及后續影響力的集合。
通過網絡傳播公眾對現實生活中某些熱點、焦點問題所持的有較強影響力、傾向性的言論和觀點。網絡輿情的表現方式多種多樣,例如:新聞評論、論壇帖子、微博博文、微信文章等。近年來,網絡輿情對政治生活秩序和社會穩定的影響與日俱增,一些重大的網絡輿情事件使人們開始認識到網絡對社會監督起到的巨大作用。
同時,網絡輿情突發事件如果處理不當,極有可能誘發民眾的不良情緒,引發群眾的違規和過激行為,進而對社會穩定構成威脅。因此,對于網絡輿情狀態的監測就變得較為重要,需要對網絡輿情的情感傾向以及觀點等進行分析和預警。目前的主流輿情系統主要有人員參與在內,比如業內中有輿情分析師篩選輿情,然后對系統進行跟蹤,從而對事件在影響力上對其輿情狀態有一個大致的判斷,但是這種方案存在監測媒體源不夠全面的缺陷,以及缺乏一個自動化的輿情指數計算方案,導致現有的輿情系統不能準確的獲取事件的具體輿情指數,而無法準確地進行預警。
發明內容
本發明提供一種網絡輿情的分析方法、裝置及計算機可讀存儲介質,其主要目的在于提高對輿情的監控和預警能力。
為實現上述目的,本發明還提供一種網絡輿情的分析方法,該方法包括:
確定輿情事件,通過分布式網絡爬蟲從預設的數據渠道采集與所述輿情事件相關的輿情文章;
對所述輿情文章進行分詞處理,獲取所述輿情文章中的詞匯集合以表征輿情文章;
采用聚類算法詞匯集合進行聚類分析,生成輿情事件的多個類型的觀點,并根據所述觀點包含的詞匯集合計算該觀點的詞向量;
從觀點包含的詞匯集合中提取一個或者多個詞匯集合,將提取的詞匯集合表征的輿情文章作為該觀點的核心話題;
將觀點的詞向量輸入到預先訓練好的情感評分模型中,輸出觀點的情感得分,并根據觀點包含的詞匯集合對應的輿情文章在各數據渠道的熱度和各數據渠道的預設權重計算觀點的熱度;
根據所述情感得分和所述熱度計算觀點的輿情指數,并判定輿情指數的絕對值大于預設閾值的觀點為異常觀點,根據所述異常觀點和該異常觀點的核心話題生成預警信息并輸出。
可選地,所述對所述輿情文章進行分詞處理,獲取所述輿情文章中的詞匯集合以表征輿情文章的步驟包括:
提取輿情文章的正文數據,通過正則表達式去除正文數據中的非中文字符;
通過分詞工具對去除非中文字符后的正文數據進行分詞處理,將正文數據轉換為以空格分割的詞匯集合;
對所述詞匯集合進行去停用詞處理,得到所述詞匯集合。
可選地,所述采用聚類算法詞匯集合進行聚類分析,生成輿情事件的多個類型的觀點,并根據所述觀點包含的詞匯集合計算該觀點的詞向量的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810544762.6/2.html,轉載請聲明來源鉆瓜專利網。





