[發明專利]一種基于新聞評論網頁的情感傾向性分析系統無效
| 申請號: | 200910086542.4 | 申請日: | 2009-06-05 |
| 公開(公告)號: | CN101593204A | 公開(公告)日: | 2009-12-02 |
| 發明(設計)人: | 高軍;王騰蛟;楊冬青;陶富民;常雷 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京紀凱知識產權代理有限公司 | 代理人: | 徐 寧;關 暢 |
| 地址: | 100871北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 新聞 評論 網頁 情感 傾向性 分析 系統 | ||
技術領域
本發明涉及一種數據挖掘系統,特別是關于一種基于新聞評論網頁的實體情感傾向性分析系統。
背景技術
情感傾向性分析是通過對新聞材料信息進行分析和挖掘,用以獲取公眾輿論對某些產品、企業、政策等實體的情感傾向。這樣就能更好地掌握公眾對政府政策、企業動態等熱點問題的情感傾向,為政府、企業的戰略決策方向提供科學依據。現有的關于產品情感分析系統主要側重于段落粒度或者句子粒度的產品評價的情感分析。此類系統主要是通過抽取新聞材料中的情感特征,利用分類或者統計的方法實現情感分析,這種方法對于情感特征抽取簡單的領域相對適用。
而由于目前日益復雜的社會政治經濟環境,上述分析系統對于復雜的分析實體不太適用。首先,在新聞評論和企業競爭力評論領域中,情感特征復雜多變,情感特征的抽取和用戶的背景知識密切相關,對某個事件的評價和相關人物、地點、組織等背景知識密切相關,這樣就很難在復雜的背景下分析出輿論對實體的情感傾向。其次,這些領域中情感分析和用戶的情感立場密切相關,例如,對一個用戶感覺正向的評論對另外的用戶感覺可能是負向的,而對于兩個對立的實體來說,對一個實體的“贊成”,可能是對另一個實體的“反對”;而對一個實體中包含的某一實體的“贊成”態度,也可能是對這個實體的“贊成”態度。這樣就不能在一個統一的立場下,分析同一實體的情感傾向。
發明內容
針對上述問題,本發明的目的是提供一種根據用戶提供的表示用戶情感立場的參考實體和情感動詞等情感分析規則,對有關新聞評論進行情感分析,得出情感傾向量化輸出的基于新聞評論網頁的實體情感傾向性分析系統。
為實現上述目的,本發明采取以下技術方案:一種基于新聞評論網頁的實體情感傾向性分析系統,其特征在于:它包括用戶輸入模塊、實體提取和層次關系發現模塊、同層實體情感提取模塊、實體特征提取模塊、實體定位模塊和情感輸出模塊;所述用戶輸入模塊包括用戶輸入的新聞網頁集合和情感分析規則;所述情感分析規則中包括參考實體和情感動詞;所述實體提取和層次關系發現模塊用于從所述新聞網頁中提取有效實體,并建立實體層次關系圖;所述同層實體情感提取模塊在所述實體層次關系圖中定位所述參考實體,利用參考實體、與參考實體同層次的有效實體和情感動詞,獲取新聞評論網頁;通過對所述情感動詞的新聞評論網頁聚類,獲得新聞評論網頁子集和對應的情感主題;所述實體特征提取模塊用于獲取待測新聞評論網頁中的中間實體,并輸出所述中間實體的情感分析數據;所述實體定位模塊中,判斷所述中間實體是否存在于所述實體情感關系圖中,如果所述中間實體不存在于所述實體情感關系圖中,則直接在所述情感輸出模塊中輸出所述情感分析數據,反之在所述實體情感關系圖中定位所述中間實體;如果所述中間實體與所述參考實體同在一情感關系樹中,則在所述情感輸出模塊中輸出參考實體的情感分析數據,反之根據中間實體所在的新聞評論語句相同情感主題的所述新聞評論網頁子集合進行相似度判定,間接獲取所述參考實體的情感分析數據。
所述實體提取和層次關系發現模塊中,通過表格結構處理和文本處理方法來提取所述有效實體。
所述情感關系樹以所述參考實體或與參考實體同層次的有效實體為根節點,根節點之間存在所述情感主題的連接關系,通過文檔聚類發現情感主題。
所述實體特征提取模塊中,通過實體抽取工具獲取中間實體。
所述實體特征提取模塊中,通過情感分析工具得到所述中間實體的情感分析數據。
所述情感動詞為表明情感傾向的動詞,包括正向的和負向的動詞,或帶有權重的動詞。
本發明由于采取以上技術方案,其具有以下優點:1、本發明通過用戶提供的實體提取規則和情感特征從新聞評論網頁中提取有效實體,并建立實體情感關系圖,對用戶的背景知識進行建模,識別實體之間和內部的層次關系,從而直接或間接的得出新聞評論網頁中針對參考實體的情感分析數據,提高情感分析的正確性。2、本發明通過在實體情感關系圖中定位中間實體的情感值,通過新聞網頁聚類的方式,發現實體情感關系圖中根節點之間不同情感主題,在情感分析中考慮用戶的立場,獲取針對參考實體的情感信息,提高情感分析的正確性。本發明可廣泛用于國家方針政策的制定和企業戰略方向的咨詢工作。
附圖說明
圖1是本發明系統的整體結構示意圖
圖2是本發明利用實體情感關系圖對新聞評論網頁做實體情感傾向性分析的流程示意圖
圖3是本發明本發明實施例的實體情感關系示意圖
實施方式
下面結合附圖和實施例對本發明進行詳細的描述。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910086542.4/2.html,轉載請聲明來源鉆瓜專利網。





