[發明專利]一種文本情感分類方法及系統有效
| 申請號: | 201210154332.6 | 申請日: | 2012-05-17 |
| 公開(公告)號: | CN102682130A | 公開(公告)日: | 2012-09-19 |
| 發明(設計)人: | 李壽山;張小倩;周國棟 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 常亮;李辰 |
| 地址: | 215123 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 分類 方法 系統 | ||
1.一種文本情感分類方法,其特征在于,包括:
參考預置的情感詞表,在待分類文本中查找情感詞,并確定與所述情感詞對應的情感極性;
判斷所述情感詞是否發生極性轉變,所述極性轉變包括:基于句子內結構的極性轉變和基于句子間轉折結構的極性轉變;
計算所述待分類文本中各個中性詞出現在每一種類別的文本中的概率,并依據所述情感詞的情感極性及所述情感詞的極性轉變結果,計算所述待分類文本中各個情感詞出現在每一種類別的文本中的概率;
依據所述待分類文本中各個中性詞及各個情感詞出現在每一種類別的文本中的概率,利用貝葉斯分類器模型對所述待分類文本進行分類。
2.根據權利要求1所述的方法,其特征在于,所述基于句子內結構的極性轉變包括:
基于否定結構的極性轉變,基于模態結構的極性轉變和基于隱含結構的極性轉變。
3.根據權利要求2所述的方法,其特征在于,所述判斷所述情感詞是否發生基于否定結構的極性轉變包括:
若所述情感詞所在的句子中出現了預設的否定結構的關鍵詞,則所述情感詞發生極性轉變。
4.根據權利要求2所述的方法,其特征在于,所述判斷所述情感詞是否發生基于模態結構的極性轉變包括:
若所述情感詞所在的句子中,在所述情感詞的前邊出現了預設的模態結構的關鍵詞,則所述情感詞發生極性轉變。
5.根據權利要求2所述的方法,其特征在于,所述判斷所述情感詞是否發生基于隱含結構的極性轉變包括:
若所述情感詞所在的句子中出現預設的隱含結構的關鍵詞,則所述情感詞發生極性轉變。
6.根據權利要求1所述的方法,其特征在于,所述判斷所述情感詞是否發生基于句子間轉折結構的極性轉變包括:
若所述情感詞所在的句子的后一句或后一段文本中出現預設的轉折結構的關鍵詞,則所述情感詞發生極性轉變。
7.根據權利要求1所述的方法,其特征在于,所述計算所述待分類文本中各個中性詞出現在每一種類別的文本中的概率,并依據所述情感詞的情感極性及所述情感詞的極性轉變結果,計算所述待分類文本中各個情感詞出現在每一種類別的文本中的概率包括:
P(wk|ci)=α·Pe(wk|ci)+(1-α)·Pf(wk|ci),
其中,P(wk|ci)為在待分類文本中,詞wk出現在ci類文本中的概率,ci包括正面和負面;α為預設的權重值;Pe(wk|ci)為通過待分類文本計算詞wk屬于情感類別的后驗概率;Pf(wk|ci)為通過詞wk在文本中所有詞中情況來計算詞wk屬于情感類別的后驗概率,k的取值可以為-1,0,1,w1表示正面情感詞,w-1表示負面情感詞,w0表示中性詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210154332.6/1.html,轉載請聲明來源鉆瓜專利網。





