[發明專利]一種文本情感分類方法及系統有效
| 申請號: | 201210154332.6 | 申請日: | 2012-05-17 |
| 公開(公告)號: | CN102682130A | 公開(公告)日: | 2012-09-19 |
| 發明(設計)人: | 李壽山;張小倩;周國棟 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 常亮;李辰 |
| 地址: | 215123 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 分類 方法 系統 | ||
技術領域
本發明涉及自然語言處理技術及模式識別領域,更具體地說,涉及一種文本情感詞分類方法及系統。
背景技術
隨著互聯網應用的普遍發展,互聯網(如博客、論壇等)上產生了大量的用戶參與的,對于人物、事件、產品等的評論信息,這些評論信息表達了用戶的各種情感色彩和情感傾向性,這不僅為商家提供了一個信息展示的平臺,也為消費者(即用戶)提供了產品使用體驗交流的平臺。如何從這些海量文本中提取這一類帶有情感的文本,并對其進行文本情感的分析和研究,具有很強的應用價值,例如,用戶可以根據商品的評論了解商品的信息,選擇合適產品;商家根據用戶的評論改進商品的品質,爭取更大的市場等。
所謂文本情感分析,就是借助計算機幫助用戶快速獲取、整理和分析相關評價信息,對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,其中,文本情感分類是文本情感分析的一項基本任務,文本情感分類是指將文本分為正面文本或者負面文本,例如,“我很喜歡這個產品”,通過情感分類,這句話將被分為正面文本,而“這本書實在太差了”,將被分類為負面文本。
現有的文本情感分類方法是基于機器學習的分類方法,該方法將人工標注的一定規模的正面文本和負面文本作為訓練樣本,通過對待分類文本中正面情感詞和負面情感詞進行統計計數,根據待分類文本中,正面情感詞和負面情感詞的統計情況對文本進行分類,這種文本情感分類方法實現簡單,但其分類效果差,例如“我不喜歡這個產品”這句話中,包括一個正面情感詞“喜歡”,應用現有的文本分類方法,很可能將這句話分為正面文本,但是這句話的整體情感極性卻是負面的,因此,通過情感詞統計計數的方法得到的分類結果的正確率低。
發明內容
本發明的目的是提供一種文本情感分類方法,已解決現有的文本情感分類方法分類結果的正確率低的問題。
為實現上述目的,本發明提供了如下技術方案:
一種文本情感分類方法,包括:
參考預置的情感詞表,在待分類文本中查找情感詞,并確定與所述情感詞對應的情感極性;
使用兩個極性轉變規則判斷所述情感詞是否發生極性轉變,所述兩個極性轉變規則包括:基于句子內結構的極性轉變規則和基于句子間轉折結構的極性轉變規則;
計算所述待分類文本中各個中性詞出現在每一種類別的文本中的概率,并依據所述情感詞的情感極性及所述情感詞的極性轉變結果,計算所述待分類文本中各個情感詞出現在每一種極性的文本中的概率;
依據所述待分類文本中各個中性詞即各個情感詞出現在每一種極性的文本中的概率,利用貝葉斯分類器模型對所述待分類文本進行分類。
上述方法,優選的,所述基于句子內結構的極性轉變規則包括:
基于否定結構的極性轉變規則,基于模態結構的極性轉變規則和基于隱含結構的極性轉變規則。
上述方法,優選的,所述基于否定結構的極性轉變規則包括:
若所述情感詞所在的句子中出現了預設的否定結構的關鍵詞,則所述情感詞發生極性轉變。
上述方法,優選的,所述基于模態結構的極性轉變規則包括:
若所述情感詞所在的句子中,在所述情感詞的前邊出現了預設的模態結構的關鍵詞,則所述情感詞發生極性轉變。
上述方法,優選的,所述基于隱含結構的極性轉變規則包括:
若所述情感詞所在的句子中出現預設的隱含結構的關鍵詞,則所述情感詞發生極性轉變。
上述方法,優選的,所述基于句子間轉折結構的極性轉變規則包括:
若所述情感詞所在的句子的后一句或后一段文本中出現預設的轉折結構的關鍵詞,則所述情感詞發生極性轉變。
上述方法,優選的,所述計算所述待分類文本中各個中性詞出現在每一種類別的文本中的概率,并依據所述情感詞的情感極性及所述情感詞的極性轉變結果,計算所述待分類文本中各個情感詞出現在每一種類別的文本中的概率包括:
P(wk|ci)=α·Pe(wk|ci)+(1-α)·Pf(wk|ci),
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210154332.6/2.html,轉載請聲明來源鉆瓜專利網。





