[發明專利]一種輿情監測的方法、裝置及系統有效
| 申請號: | 201911404334.4 | 申請日: | 2019-12-30 |
| 公開(公告)號: | CN111160019B | 公開(公告)日: | 2023-08-15 |
| 發明(設計)人: | 董浩俊;胡坤;房啟麾;趙文奇 | 申請(專利權)人: | 中國聯合網絡通信集團有限公司;聯通系統集成有限公司;聯通(黑龍江)產業互聯網有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/169;G06F16/35 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張寧;劉芳 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 輿情 監測 方法 裝置 系統 | ||
本發明提供一種輿情監測的方法、裝置及系統,該方法,包括:獲取多個原始輿情信息;對所述原始輿情信息進行去標簽、清洗處理,得到輿情處理信息;將所述輿情處理信息進行緩存,通過文本分析進行識別標注,得到與所述原始輿情信息對應的標注輿情信息。減少了人工成本,提高了輿情監測的準確率、有效性,極大的提高了輿情監測的效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種輿情監測的方法、裝置及系統。
背景技術
目前,通過面向各大運營商進行輿情分析,可基于輿情分析的結果為各大運營商的運營起到輔助決策的作用。輿情分析就是根據特定問題的需要,對針對這個問題的輿情進行深層次的思維加工和分析研究,得到相關結論的過程。
現有技術中,在進行輿情分析時,一般采用人工研判為主系統判斷為輔的方式進行分析,而且,對于部分輿情所屬業務的識別是采用基于關鍵詞簡單匹配的方式來確定業務方式。
然而現有技術中,基于人工研判為主的方式進行地分析,將會導致現有分析過程在輿情處理的實效性較差,而且采用關鍵詞簡單匹配的方法來確定業務方式時,由于采用的匹配方式較為簡單,從而將會造成輿情分析的準確率較低。
發明內容
本發明提供一種輿情監測的方法、裝置及系統,以減少了人工成本,提高輿情監測的準確率、有效性,極大的提高了輿情監測的效率。
第一方面,本發明實施例提供的一種輿情監測的方法,包括:
獲取多個原始輿情信息;
對所述原始輿情信息進行去標簽、清洗處理,得到輿情處理信息;
將所述輿情處理信息進行緩存,通過文本分析進行識別標注,得到與所述原始輿情信息對應的標注輿情信息。
在一種可能的設計中,通過文本分析進行識別標注,得到與所述原始輿情信息對應的標注輿情信息,包括:
對輿情處理信息進行分詞,將分析后的輿情處理信息在地域詞典中進行匹配,若匹配成功則對輿情信息進行地域標識,得到地域輿情處理信息;
根據所述地域輿情處理信息出現的位置以及頻次,獲得所述地域輿情處理信息對應的評分;
根據所述評分的大小依次進行排序,并將最高評分對應的所述地域輿情處理信息進行地域標注,得到與原始輿情信息對應的標注輿情信息。
在一種可能的設計中,所述地域詞典通過獲取地域詞匯,并將所述地域詞匯整理構建獲得。
在一種可能的設計中,通過文本分析進行識別標注,得到與所述原始輿情信息對應的標注輿情信息,還包括:
獲取輿情處理信息中的摘要文本信息,提取、標注所述摘要文本信息中的轉折句,得到與所述原始輿情信息對應的標注輿情信息。
在一種可能的設計中,所述方法,還包括:
對所述摘要文本信息中每個摘要語句求取相似性;
獲取最高相似性對應的摘要語句并刪除,得到保留摘要語句并進行標注,得到與所述原始輿情信息對應的標注輿情信息。
在一種可能的設計中,通過文本分析進行識別標注,得到與所述原始輿情信息對應的標注輿情信息,包括:
將所述輿情處理信息劃分為第一類文本信息、第二類文本信息;
對所述第二類文本信息進行干擾項排除處理,通過機器學習模型對所述第二類文本信息進行監督分類,獲取正向輿情信息并標注,得到與所述原始輿情信息對應的標注輿情信息;其中機器學習模型采用情感詞庫作為訓練數據集進行監督訓練,以輸出分類為正向輿情信息的機器學習模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國聯合網絡通信集團有限公司;聯通系統集成有限公司;聯通(黑龍江)產業互聯網有限公司,未經中國聯合網絡通信集團有限公司;聯通系統集成有限公司;聯通(黑龍江)產業互聯網有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911404334.4/2.html,轉載請聲明來源鉆瓜專利網。





