[發明專利]一種基于語義的網絡智能輿情監測系統及其工作方法有效
| 申請號: | 201210170862.X | 申請日: | 2012-05-29 |
| 公開(公告)號: | CN102708096A | 公開(公告)日: | 2012-10-03 |
| 發明(設計)人: | 代松;姬東鴻 | 申請(專利權)人: | 代松 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 武漢天力專利事務所 42208 | 代理人: | 吳曉穎;馮衛平 |
| 地址: | 430000 湖北省武漢市*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 網絡 智能 輿情 監測 系統 及其 工作 方法 | ||
技術領域
本發明屬于自然語言處理領域,特別涉及一種基于語義的網絡智能輿情監測系統及其工作方法。
背景技術
近年來,互聯網發展迅速,作為繼電視、廣播、報紙之外的第四媒體,已經成為反映社會輿情的一個重要載體。另一方面,由于網絡的開放性和虛擬性,網上輿情已經越來越復雜,對現實生活的影響與日俱增,一些重大的網絡輿情事件往往對社會產生較大的影響力。輿情監測的目的,即為準確有效地掌握網絡輿情現狀,加強對網絡輿情的及時監測和跟蹤,以便準確快速地發現互聯網上的各類輿情,產生輿論導向并積極化解輿論危機,對促進社會和企業的健康發展具有重要的現實意義。對政府部門、公眾媒體和大型企業來說,如何加強對網絡輿情的及時監測,以及時采取措施進行有效應對,成為網絡輿情管理的一大難點。
發明內容
本發明就是針對上述背景技術中的不足之處,而提出的一種基于語義的網絡智能輿情監測系統及其工作方法,其搜索的結果不是簡單的包含某個或某類關鍵詞的網頁集合,而是與所設定的監測事件具有相同語義(即在意義上相同)的文本信息,具有較高的準確率。
本發明的目的是通過如下技術措施來實現的。
一種基于語義的網絡智能輿情監測系統,該系統包括智能爬蟲爬取模塊、命名實體抽取模塊、概念智能識別模塊、基于語義的傾向性分析模塊、話題抽取模塊和智能統計分析模塊,所述智能爬蟲爬取模塊用于從互聯網上采集輿情信息,并存儲到數據庫中,所述命名實體抽取模塊、概念智能識別模塊、基于語義的傾向性分析模塊、話題自動抽取模塊用于對輿情信息進行智能分析和加工,所述智能統計分析模塊把輿情信息中經過分析處理的數據以各種形式展現給用戶并提供預警。各模塊具體功能如下:
智能爬蟲爬取模塊:傳統的輿情監測系統采用關鍵詞或關鍵詞組合的方式進行搜索,該方法存在兩個問題:一是基于關鍵詞搜索的準確度不高,結果可能包含大量噪音,例如要搜索“北大”(這里指的是北京大學)的信息,那么包含詞條“北大荒”的文本也會被搜索出來;二是傳統輿情監測系統的關鍵詞集需人工收集并添加,繁瑣且費時。造成以上問題的根本原因是,系統無法真正理解搜索詞的意義。本系統采用智能爬蟲技術,通過“理解”輸入的關鍵詞或句子的意思,在文本中找出相應的內容。
命名實體抽取模塊:輿情監測的內容中可能包含人物、地點和組織機構的信息。而傳統的輿情監測系統無法自動識別出文本中包含的這些內容,只能由人工進行添加。本系統自動對人物名稱、地點名稱和組織機構的名稱(即命名實體)進行識別,并提取與之相關的信息。全部過程由機器自動完成,無需人工干預。
概念智能識別模塊:傳統的輿情監測系統采用關鍵詞或關鍵詞組合的方式進行監測,一旦發現信息中包含關鍵詞或其組合,則發布預警信息。然而,利用關鍵詞檢索得到的結果可能包含大量噪音,而有用的信息卻可能因為不在關鍵詞列表中而被過濾掉。本系統采用基于概念的識別搜索機制,通過自動識別出意義相同的概念,過濾大量無關的信息,從而得到的結果具有較高的準確率。例如,給定一個新聞線索“腐敗”,本系統自動監測與“腐敗”相關的“行賄受賄”、“公款吃喝”、“買官賣官”等內容。
基于語義的傾向性分析模塊:本系統實現了對輿情的傾向性進行自動分析,例如,調查網民對某一事件的評論是正面還是負面的。傳統的輿情監測系統無法進行傾向性分析,或者傾向性分析方法是基于關鍵詞的。這種方法的主要問題是準確度較低。利用基于語義的傾向性自動分析技術,本模塊實現了對輿情的語義分析,并能給出基于事件的某個側面的傾向性評價結果。
話題抽取模塊:話題就是一個核心事件或活動以及與之直接相關的事件或活動。而一個事件(Event)通常由某些原因、條件引起,發生在特定時間、地點,涉及某些對象(人或物),并可能伴隨某些必然結果。通常情況下,可以簡單地認為話題就是若干對某事件相關報道的集合。話題分析具體包括話題檢測與跟蹤,定義為“在新聞專線(Newswire)和廣播新聞等來源的數據流中自動發現主題并把主題相關的內容聯系在一起的技術”。本模塊在海量信息中搜索同一話題的內容,并自動進行歸類,同時給出話題名稱,方便用戶查看。
智能統計分析模塊:將輿情監測的結果進行分析匯總,并以圖文并茂的形式展現給用戶。統計方式可由用戶自行定義,如按時間、按來源、按輿情類別、按用戶傾向性等。
本發明還提供一種基于語義的網絡智能輿情監測系統的工作方法,該方法包括以下步驟:
(1)構建語義本體,用XML文檔描述本體,在構建好本體以后,通過解析XML文檔,將本體存儲到數據庫中,便于其它模塊使用;具體構建步驟如下
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于代松,未經代松許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210170862.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種白涼粉膏的加工方法
- 下一篇:一種方位伽馬測量方法及設備





