[發(fā)明專利]一種情緒文本的情緒特征確定方法及裝置在審
| 申請?zhí)枺?/td> | 201410571054.3 | 申請日: | 2014-10-23 |
| 公開(公告)號: | CN104346326A | 公開(公告)日: | 2015-02-11 |
| 發(fā)明(設計)人: | 李壽山;劉歡歡;周國棟;段湘煜 | 申請(專利權(quán))人: | 蘇州大學 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/30;G06F17/27 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 常亮 |
| 地址: | 215137 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 情緒 文本 特征 確定 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,尤其是一種情緒詞文本的情緒特征確定方法及裝置。
背景技術(shù)
當今,互聯(lián)網(wǎng)已經(jīng)成為信息的重要載體,尤其是近些年,隨著電子商務及社交網(wǎng)站的興起,互聯(lián)網(wǎng)上出現(xiàn)了大量的評論,評論中一般包含情緒詞,包含情緒詞的文本可以稱為情緒文本。研究情緒文本的情緒信息有助于了解和分析人們對事物或事件的觀點態(tài)度,例如,包含開心、高興等情緒詞的文本表達的是對事物或事件的支持,相反,包含生氣、煩惱等情緒詞的文本標的是反對。在此背景下,情緒分析正逐漸稱為自然語言處理領(lǐng)域中一項越來越受關(guān)注的研究課題。
目前,利用現(xiàn)有的情緒詞表對情緒文本的情緒進行確定,即若情緒文本中出現(xiàn)了情緒詞表中的某個情緒詞,則認為該情緒文本具有該類情緒特征。例如,情緒文本出現(xiàn)了情緒詞表中包含的“開心”,則確定該文本具有“開心”的情緒特征。
然而,現(xiàn)實的情緒文本中經(jīng)常存在情緒隱藏的情況,即雖然情緒文本中出現(xiàn)了某個情緒詞,但并未真正表達該情緒,例如“要是你在的話,她可能就開心了”。因此,利用現(xiàn)有的情緒確定方法確定出來的情緒特征存在誤差,準確性較差。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種情緒文本的情緒特征確定方法及裝置,用以解決現(xiàn)有技術(shù)中的情緒特征確定方法準確性較差的技術(shù)問題。為實現(xiàn)所述發(fā)明目的,本發(fā)明提供的技術(shù)方案如下:
一種情緒文本的情緒特征確定方法,包括:
在情緒文本集合中,確定待確定情緒文本;其中,所述待確定情緒文本為包含目標情緒詞的情緒文本;
在所述待確定情緒文本中,提取所述情緒詞的特征詞集合;其中,所述特征詞集合包含的是與所述情緒詞具有上下文關(guān)聯(lián)關(guān)系的特征詞語;
依據(jù)所述情緒文本集合及所述特征詞集合,生成分類器;
利用所述分類器對所述待確定情緒文本進行分類,獲得分類結(jié)果;
依據(jù)所述分類結(jié)果,確定所述待確定情緒文本的情緒特征;其中,所述情緒特征為情緒發(fā)生或情緒隱藏。
可選地,上述的情緒文本的情緒特征確定方法,所述依據(jù)所述情緒文本集合及所述特征詞集合,生成分類器,包括:
對所述情緒文本集合中的部分情緒文本進行標注,獲得訓練集;其中,所述標注為正標注或負標注;
利用所述訓練集對所述特征詞集合進行訓練,獲得分類器。
可選地,上述的情緒文本的情緒特征確定方法,所述利用所述訓練集對所述特征詞集合進行訓練,獲得分類器,包括:
依據(jù)所述正標注及所述負標注,將所述訓練集劃分為正負兩個訓練子集;
針對所述特征詞集合中每個特征詞,計算分別在所述正負兩個訓練子集中出現(xiàn)的概率,獲得貝葉斯分類器。
可選地,上述的情緒文本的情緒特征確定方法,所述貝葉斯分類器包含預設先驗概率及正負兩個訓練子集各自對應的概率;
其中,所述利用所述分類器對所述待確定情緒文本進行分類,獲得分類結(jié)果,包括:
利用所述預設先驗概率及正訓練子集對應的概率,計算第一后驗概率正分類值;
利用所述預設先驗概率及負訓練子集對應的概率,計算第二后驗概率負分類值;
將所述正分類值第一后驗概率及所述負分類值第二后驗概率中的較大值確定為分類結(jié)果。
可選地,上述的情緒文本的情緒特征確定方法,所述依據(jù)所述分類結(jié)果,確定所述待確定情緒文本的情緒特征,包括:
當所述分類結(jié)果為正分類值第一后驗概率時,確定所述待確定情緒文本的情緒特征為情緒發(fā)生;
當所述分類結(jié)果為負分類值第二后驗概率時,確定所述待確定情緒文本的情緒特征為情緒隱藏。
可選地,上述的情緒文本的情緒特征確定方法,所述特征詞集合包括:段落特征詞集合、句子特征詞集合、子句特征詞集合及關(guān)鍵詞集合中的任意一個或多個的組合;其中:
所述段落特征詞集合包含的是與所述情緒詞在同一段落的詞語;
所述句子特征詞集合包含的是與所述情緒詞在同一句子的詞語;
所述子句特征詞集合包含的是與所述情緒詞在同一子句的詞語;
所述關(guān)鍵詞集合包含的是表達預設假設含義的詞語。
本申請還提供了一種情緒文本的情緒特征確定裝置,包括:
情緒文本確定模塊,用于在情緒文本集合中,確定待確定情緒文本;其中,所述待確定情緒文本為包含目標情緒詞的情緒文本;
特征詞提取模塊,用于在所述待確定情緒文本中,提取所述情緒詞的特征詞集合;其中,所述特征詞集合包含的是與所述情緒詞具有上下文關(guān)聯(lián)關(guān)系的特征詞語;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州大學,未經(jīng)蘇州大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410571054.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





