[發明專利]一種智能的輿情突發事件應急處理系統及方法有效
| 申請號: | 201510243751.0 | 申請日: | 2015-05-14 |
| 公開(公告)號: | CN104820629B | 公開(公告)日: | 2018-01-30 |
| 發明(設計)人: | 陳勇;陳金勇 | 申請(專利權)人: | 中國電子科技集團公司第五十四研究所 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F17/30 |
| 代理公司: | 河北東尚律師事務所13124 | 代理人: | 王文慶 |
| 地址: | 050081 河北省石家*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 輿情 突發事件 應急 處理 系統 方法 | ||
技術領域
本發明屬于計算機應用領域,涉及將自然語言處理技術、本體理論和語義關聯技術應用于互聯網輿情突發事件的智能識別和防控方案的自動生成。它基于計算機信息處理方法實現對應急防控預案的格式化轉化,實現輿情突發事件情景與預案之間的語義匹配,實現對各種互聯網輿情突發事件的準確識別和輔助決策。
背景技術
隨著互聯網技術的不斷發展,互聯網已成為一種被廣泛使用的大眾媒介,其觸角幾乎伸向社會的各個領域,并逐漸成為公眾輿論的一個新的重要媒介。網絡輿情是公眾在互聯網上公開表達的對某種社會現象或社會問題的具有一定影響力和傾向性的共同意見,網絡輿情對政治生活秩序和社會穩定的影響與日俱增,一些網絡輿情突發事件不能及時妥善處理,極有可能誘發民眾的不良情緒及不良行為的發生,進而對社會穩定形成嚴重威脅。迫切需要一種技術手段能夠實現對網絡輿情信息的自動監控,能夠對輿情突發事件的處置提供決策支持。
發明內容
本發明就是針對上述需求,提出了一種計算機應用系統―輿情突發事件應急處理系統,它能夠對互聯網輿情進行實時監控,能夠輔助決策者根據輿情突發事件的實際情況有針對性地形成相適合的防控方案,加快對網絡輿情突發事件的處置響應速度。
本發明所要解決的技術問題由以下技術方案實現:
一種智能的輿情突發事件應急處理系統,其特征在于:該系統包括互聯網信息采集與解析模塊、互聯網信息分析模塊、網絡文本類別判斷與聚類分析模塊、應急處理方案生成模塊和應急處理效果評估模塊;所述互聯網信息采集與解析模塊用于從互聯網上采集信息,抽取出網頁中自然語言文字以及網頁的元數據信息,并保存到數據庫中;所述互聯網信息分析模塊用于對采集來的信息中的自然語言文字進行特征抽取,形成文本特征;所述網絡文本類別判斷與聚類分析模塊用于對網絡文本的類別進行判斷,對累積網絡文本進行聚類分析;所述應急處理方案生成模塊用于根據輿情事件的具體情況自動生成相應的處理預案,決策人員可以基于處理預案制定執行方案;所述應急處理效果評估模塊用于對執行方案的執行效果進行評估。
一種智能的輿情突發事件應急處理系統及方法,其特征在于該方法包括以下步驟:
①互聯網信息采集與解析:由連接互聯網的計算機從互聯網論壇、博客、新聞網站上采集論壇帖子、博客內容和網站新聞網頁等網絡數據,然后,利用計算機采用基于規則的信息抽取技術自動地對網絡數據進行解析,從其中抽取兩類信息:自然語言文字信息和網頁的元數據信息;自然語言文字信息包括新聞標題、新聞正文、論壇帖子標題、帖子內容等信息;網頁的元數據信息包括發表時間、作者、發帖者、帖子回復量、帖子閱讀量、出現的網站名稱、網站URL等信息,解析出來的信息保存到數據庫中,信息采集與解析是一個持續的過程,形成對互聯網站的自動連續監控;
②互聯網信息分析:首先利用自然語言處理技術的中文分詞方法對網絡文本的標題和正文內容分別進行分詞,并對分詞結果中每個詞項的詞性進行標注,之后舍棄掉除名詞、動詞、形容詞之外的詞項,然后利用文本多精度表示方法抽取網絡文本的單個詞項特征和詞項關聯特征,再根據分詞結果中的詞性標注情況識別出網絡文本中的地理位置特征和人物特征,地理位置特征是網絡文本中出現的地理位置名稱、人物特征是網絡文本中出現的人物名稱;
③將步驟②處理后的網絡文本中的詞項與計算機數據庫中設定的輿情類別的詞項特征進行比對匹配,并根據匹配結果將網絡文本按照計算機數據庫中設定的輿情類別進行歸類處理;將不能歸類的網絡文本進行聚類分析,把內容相近的網絡文本聚成簇,若簇內網絡文本數量超出設定閾值,則對簇內網絡文本進行輿情類別的詞項特征抽處理,并將抽取的輿情類別的詞項特征補充到計算機數據庫中;對于完成歸類的網絡文本轉入步驟④;其中,匹配內容包括單個詞項特征、詞項關聯特征、地理位置特征和人物特征;
④如果在指定時間段內,屬于某一類別的網絡文本的數量或者出現該類別網絡文本的網站數量超過指定的閾值,則啟動應急預案;
完成智能輿情突發事件的應急處理。
其中,在步驟④之后還包括應急處理效果評估步驟:首先按照評估指標采集指標數據,然后將指標數據輸入評估公式得出量化評估結果。
其中,在步驟③中根據匹配結果將網絡文本按照計算機數據庫中設定的輿情類別進行歸類處理具體為:網絡文本類別判斷的方法是將網絡文本的詞項與每個輿情類別的詞項特征進行比對匹配,分別在單個詞特征、詞關聯特征、地理位置特征和人物特征四個方面進行匹配運算,根據匹配情況得到網絡文本與各個輿情類別的相似度值,將文本歸屬為相似度值最高的輿情類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技集團公司第五十四研究所,未經中國電子科技集團公司第五十四研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510243751.0/2.html,轉載請聲明來源鉆瓜專利網。





