[發(fā)明專利]一種基于上下文語境的中文分句情感極性判別方法無效
| 申請(qǐng)?zhí)枺?/td> | 201210388149.2 | 申請(qǐng)日: | 2012-10-12 |
| 公開(公告)號(hào): | CN102929860A | 公開(公告)日: | 2013-02-13 |
| 發(fā)明(設(shè)計(jì))人: | 張宇;朱衛(wèi)祥 | 申請(qǐng)(專利權(quán))人: | 浙江理工大學(xué) |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27 |
| 代理公司: | 杭州天勤知識(shí)產(chǎn)權(quán)代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310018 浙江*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 上下文 語境 中文 分句 情感 極性 判別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及中文分句情感計(jì)算領(lǐng)域,具體涉及一種基于上下文語境的中文分句情感極性判別方法。?
背景技術(shù)
隨著Web2.0時(shí)代的到來,互聯(lián)網(wǎng)交互技術(shù)取得迅猛發(fā)展,網(wǎng)絡(luò)上出現(xiàn)了大量帶有主觀情感的評(píng)論信息。這些評(píng)論信息往往反映了人們對(duì)事物或事件的觀點(diǎn)和看法。例如在電子商務(wù)平臺(tái)上,一筆交易可能會(huì)對(duì)應(yīng)一條文字評(píng)論,這些評(píng)論通常表明了買家對(duì)產(chǎn)品質(zhì)量、賣家服務(wù)、物流速度等多個(gè)方面的看法,因此這些評(píng)論中包含了大量有用的信息,對(duì)商家的廣告投放、市場(chǎng)營(yíng)銷、商業(yè)決策以及買家的購(gòu)物選擇都具有重要的參考價(jià)值和實(shí)際意義。目前單純采用人工分析篩選的方法已經(jīng)無法滿足海量數(shù)據(jù)處理的需求,因此利用計(jì)算機(jī)進(jìn)行情感分析的技術(shù)應(yīng)運(yùn)而生。?
面向文本的情感極性判別通常可被劃分為四個(gè)級(jí)別:詞語級(jí)情感極性判別、分句級(jí)情感極性判別、篇章級(jí)情感極性判別以及海量數(shù)據(jù)級(jí)的情感極性判別。?
申請(qǐng)?zhí)枮?01010238370.0的發(fā)明公開了一種漢語文本情感識(shí)別方法,包括下列步驟:1)使用自然語言處理工具對(duì)漢語文本進(jìn)行預(yù)處理,得到句子成分之間的依存關(guān)系;2)根據(jù)情感識(shí)別變量的確定方法確定句子所包含的情感識(shí)別變量并將句子成分賦值給情感識(shí)別變量;3)根據(jù)情感識(shí)別變量的賦值方法確定情感識(shí)別變量的取值;4)根據(jù)情感規(guī)則確定句子表達(dá)的情感類型。?
目前學(xué)術(shù)界關(guān)于詞語級(jí)、篇章級(jí)和海量數(shù)據(jù)級(jí)的情感極性判別研究較多,但是分句級(jí)的情感判別研究則很少有人涉及。而目前現(xiàn)有的分句級(jí)情?感極性判別多采用基于詞表的嚴(yán)格匹配算法、統(tǒng)計(jì)預(yù)測(cè)或機(jī)器學(xué)習(xí)等方法,而很少關(guān)注中文語法規(guī)則在情感計(jì)算當(dāng)中的作用,特別是缺少基于上下文語境判別情感極性的方法。?
發(fā)明內(nèi)容
本發(fā)明提供了一種基于上下文語境的中文分句情感極性判別方法,綜合競(jìng)拍規(guī)則和上下文語境判別中文分句的情感極性,提高中文分句情感極性判斷的準(zhǔn)確性。?
一種中文分句的情感極性判別方法,包括如下步驟:?
(1)對(duì)中文分句進(jìn)行中文分詞和詞性的標(biāo)注,獲取每個(gè)中文分句中各自的特征值、否定詞、副詞和情感詞,將中文分句的情感詞與情感詞表進(jìn)行匹配,確定情感詞的情感極性,得到中文分句的情感極性;?
(2)根據(jù)中文分句中的副詞計(jì)算每個(gè)中文分句的情感強(qiáng)烈程度;?
(3)提取中文分句中的連接詞,對(duì)于相鄰的三個(gè)中文分句,根據(jù)連接詞以及與其相鄰的中文分句的情感強(qiáng)烈程度修正步驟(1)中獲得的中文分句情感極性。?
通常情況下,中文分詞的準(zhǔn)確率與所處的領(lǐng)域密切相關(guān),因此,先建立領(lǐng)域?qū)S性~匯表,在中文分詞過程時(shí),執(zhí)行專有詞匯優(yōu)先結(jié)合原則,提高中文分詞的準(zhǔn)確率和精度,確保中文分詞的正確性。?
依據(jù)詞性可以將中文分句劃分為名詞、動(dòng)詞、形容詞、副詞以及代詞等,根據(jù)情感極性判別的需求,依據(jù)詞性對(duì)中文分詞結(jié)果進(jìn)行篩選,去掉停用詞以及無用詞,從而獲得精簡(jiǎn)的中文分詞序列。?
對(duì)中文分句進(jìn)行中文分詞和詞性標(biāo)注后,每個(gè)分句都被降維映射為一個(gè)四維向量,該四維向量包括特征值、否定詞、副詞以及情感詞。?
其中,特征值用于確定所關(guān)注對(duì)象的特征;否定詞用于實(shí)現(xiàn)語義的翻轉(zhuǎn);副詞用于描述情感的強(qiáng)烈程度;情感詞用語確定情感極性。?
將四維向量中的情感詞與情感詞表進(jìn)行匹配,確定該情感詞的情感極性,從而得到中文分句的情感極性。?
如果中文分句中出現(xiàn)否定詞,則該中文分句的情感極性反轉(zhuǎn)。例如依?據(jù)情感詞的情感極性判斷中文分句情感極性為正面,如果分句中存在一個(gè)否定詞,則相應(yīng)的中文分句情感極性變?yōu)樨?fù)面。?
由于中文分句的情感極性除了與中文分句自身所表達(dá)的內(nèi)容有關(guān),大多情況下,還與其上下文的情感語境有關(guān),因此,若要準(zhǔn)確判別中文分句的情感極性,還需要考慮與其相鄰的中文分句的情感語境。?
本發(fā)明中依據(jù)相鄰三個(gè)中文分句各自的情感極性以及中文分句間的連接詞綜合確定中文分句的情感極性。?
依據(jù)獲得的每個(gè)中文分句的副詞計(jì)算每個(gè)中文分句的情感強(qiáng)烈程度。?
連接詞的上下文關(guān)系可以分為兩種:承上和啟下。承上表明該連接詞所在的中文分句與前一分句有語義上的關(guān)聯(lián),啟下表明該連接詞所在的中文分句與后一分句有語義上的關(guān)聯(lián)。?
連接詞情感極性關(guān)系可以分為兩種:轉(zhuǎn)折和順承。轉(zhuǎn)折表明利用該連接詞連接的兩中文分句的情感極性相反,順承表明利用該連接詞連接的兩中文分句的情感極性相同。?
對(duì)連接詞分別進(jìn)行上下文關(guān)系以及情感極性關(guān)系的標(biāo)注。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江理工大學(xué),未經(jīng)浙江理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210388149.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 自動(dòng)創(chuàng)建上下文信息提供配置的系統(tǒng)
- 用于管理上下文的方法、系統(tǒng)和裝置
- 一種基于本體的上下文感知應(yīng)用平臺(tái)框架模型
- 一種基于上下文感知的智能家居系統(tǒng)
- 實(shí)現(xiàn)上下文感知業(yè)務(wù)應(yīng)用的方法和相關(guān)裝置
- 一種多推理引擎融合上下文感知系統(tǒng)及其工作方法
- 多個(gè)并發(fā)上下文虛擬演進(jìn)型會(huì)話管理(虛擬ESM)
- 一種基于異質(zhì)上下文感知的推薦方法
- 一種可提高上下文質(zhì)量的本體建模方法及裝置
- 微服務(wù)全局上下文控制方法及系統(tǒng)
- 用于管理語境相關(guān)信息的系統(tǒng)、移動(dòng)站、方法和計(jì)算機(jī)程序產(chǎn)品
- 文字輸入過程中的自動(dòng)校對(duì)方法
- 使用與信息關(guān)聯(lián)的語義語境便于協(xié)作搜索
- 記錄語境信息以及追溯生詞語境的方法和系統(tǒng)
- 基于語境的鍵盤
- 用于管理語音系統(tǒng)中的對(duì)話語境的系統(tǒng)和方法
- 用于管理語境相關(guān)信息的系統(tǒng)、移動(dòng)站和方法
- 減少主觀干擾內(nèi)容的方法和系統(tǒng)
- 依存句法樹構(gòu)建系統(tǒng)
- 會(huì)話語境劃分方法與系統(tǒng)、交互方法與交互系統(tǒng)





