[發(fā)明專利]一種方面級(jí)用戶產(chǎn)品評(píng)論情感分析方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202010065377.0 | 申請(qǐng)日: | 2020-01-20 |
| 公開(公告)號(hào): | CN111274398B | 公開(公告)日: | 2022-06-14 |
| 發(fā)明(設(shè)計(jì))人: | 陳羽中;莊天豪;劉漳輝 | 申請(qǐng)(專利權(quán))人: | 福州大學(xué) |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 福州元?jiǎng)?chuàng)專利商標(biāo)代理有限公司 35100 | 代理人: | 丘鴻超;蔡學(xué)俊 |
| 地址: | 350108 福建省福州市*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 方面 用戶 產(chǎn)品 評(píng)論 情感 分析 方法 系統(tǒng) | ||
本發(fā)明涉及一種方面級(jí)用戶產(chǎn)品評(píng)論情感分析方法及系統(tǒng),該方法包括以下步驟:步驟A:提取用戶的產(chǎn)品評(píng)論、評(píng)論涉及的產(chǎn)品方面詞、產(chǎn)品方面詞的位置信息,并對(duì)產(chǎn)品方面的情感極性進(jìn)行標(biāo)注,構(gòu)建訓(xùn)練集
技術(shù)領(lǐng)域
本發(fā)明涉及自然語(yǔ)言處理與情感分析應(yīng)用領(lǐng)域,具體涉及一種方面級(jí)用戶產(chǎn)品評(píng)論情感分析方法及系統(tǒng)。
背景技術(shù)
情感分析(Sentiment Analysis,SA),又被稱為意見挖掘,是自然語(yǔ)言處理中文本分類任務(wù)的一項(xiàng)基本任務(wù),其基本目標(biāo)是從文本中識(shí)別觀點(diǎn),分析其情感傾向性。隨著近年來(lái)社交媒體和電子商務(wù)的興起,越來(lái)越多研究人員參與到該領(lǐng)域的研究。隨著研究的深入,人們對(duì)情感分析的分類粒度要求也越來(lái)越高,從文檔級(jí)、句子級(jí)再發(fā)展到如今的方面級(jí)(aspect level)。方面級(jí)情感分析的目標(biāo)是識(shí)別給定的句子中的每一個(gè)方面的情感極性(積極、消極和中性)。如在句子“這款筆記本電腦的分辨率很高,但是價(jià)格一點(diǎn)貴”中,評(píng)論者對(duì)筆記本電腦(實(shí)體)的某個(gè)方面“分辨率”的情感極性為積極,而對(duì)另一個(gè)產(chǎn)品方面“價(jià)格”的情感極性為消極。
方面級(jí)情感分析的早期研究通常采用傳統(tǒng)的監(jiān)督學(xué)習(xí)算法,該類研究著重于通過諸如詞袋模型、LDA等方法來(lái)提取特征以訓(xùn)練分類器。這些方法需要復(fù)雜的特征工程來(lái)提取文本特征,十分繁瑣。最近,端到端的神經(jīng)網(wǎng)絡(luò),例如長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-TermMemory networks,LSTM)和記憶網(wǎng)絡(luò)(Memory Network,MemNet),已經(jīng)在該任務(wù)上表現(xiàn)出最先進(jìn)的性能,而且無(wú)需任何費(fèi)力的特征工程。Wang等提出的ATAE-LSTM方法首次結(jié)合了LSTM和注意力機(jī)制,通過LSTM提取評(píng)論的上下文語(yǔ)義信息,再利用注意力機(jī)制提取評(píng)論對(duì)于情感分類最為重要的部分,該方法取得了當(dāng)時(shí)最先進(jìn)的結(jié)果。Tang等人將MemNet引入情感分析任務(wù),通過外部記憶機(jī)制和多層注意力機(jī)制,在保存原本的語(yǔ)義信息的同時(shí)提取了句子中對(duì)方面信息最重要的片段,并且MemNet的參數(shù)遠(yuǎn)遠(yuǎn)少于LSTM網(wǎng)絡(luò),使得MemNet的訓(xùn)練時(shí)間遠(yuǎn)少于基于LSTM的方法。Ma等人提出IAN模型,將評(píng)論和方面信息分別使用基于注意力機(jī)制的LSTM進(jìn)行建模,并且對(duì)生成的表征向量進(jìn)行了交互操作,從而更好地提取了上下文語(yǔ)義信息。Chen等人提出RAM模型,該模型將LSTM與MemNet結(jié)合,并且使用GRU來(lái)對(duì)MemNet的計(jì)算層進(jìn)行更新,并且引入位置權(quán)重,使得模型對(duì)情感信息的提取更加精確有效。Gu等人首次提出將位置信息與評(píng)論一起作為輸入,由深度神經(jīng)網(wǎng)絡(luò)自行學(xué)習(xí),通過分層交互注意力機(jī)制使得評(píng)論和方面信息更好的交互和融合,并且減少了噪聲的影響。Xue等人的研究區(qū)別于以往的研究,將一種新型門控機(jī)制Tanh-ReLU與CNN結(jié)合起來(lái)進(jìn)行學(xué)習(xí),彌補(bǔ)了CNN網(wǎng)絡(luò)在自然語(yǔ)言處理方面的不足,該門控機(jī)制Tanh-ReLU可以根據(jù)給定的方面或?qū)嶓w選擇性地輸出情感特征。該方法比現(xiàn)有模型中使用的注意力層簡(jiǎn)單得多。現(xiàn)有的基于注意力機(jī)制的模型雖然能將注意力權(quán)重集中到與產(chǎn)品方面相關(guān)的單詞上,但是無(wú)法捕獲長(zhǎng)期依賴,同時(shí)也容易受到噪聲影響從而將注意力集中到不相關(guān)的詞上。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種方面級(jí)用戶產(chǎn)品評(píng)論情感分析方法及系統(tǒng),該方法及系統(tǒng)有利于提高情感分類的準(zhǔn)確性。
為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:一種方面級(jí)用戶產(chǎn)品評(píng)論情感分析方法,包括以下步驟:
步驟A:提取用戶的產(chǎn)品評(píng)論、評(píng)論涉及的產(chǎn)品方面詞、產(chǎn)品方面詞的位置信息,并對(duì)產(chǎn)品方面的情感極性進(jìn)行標(biāo)注,構(gòu)建訓(xùn)練集SA;
步驟B:使用訓(xùn)練集SA,訓(xùn)練用于方面級(jí)用戶產(chǎn)品評(píng)論情感分析的融合記憶網(wǎng)絡(luò)與雙向長(zhǎng)短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)網(wǎng)絡(luò)模型M;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010065377.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 全球評(píng)論板系統(tǒng)及其實(shí)現(xiàn)方法
- 一種評(píng)論推薦方法和系統(tǒng)
- 評(píng)論內(nèi)容的提供方法、裝置和終端設(shè)備
- 評(píng)論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于人工智能構(gòu)建評(píng)論圖譜的方法和裝置
- 一種電子商務(wù)產(chǎn)品評(píng)論質(zhì)量鑒別系統(tǒng)
- 音頻文件的評(píng)論方法及裝置
- 評(píng)論的展示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 在線評(píng)論篩選裝置
- 用于生成評(píng)論的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)





