[發(fā)明專利]文本情感分析方法、裝置、存儲介質(zhì)和計算機設(shè)備有效
| 申請?zhí)枺?/td> | 201710620545.6 | 申請日: | 2017-07-26 |
| 公開(公告)號: | CN107609009B | 公開(公告)日: | 2020-02-18 |
| 發(fā)明(設(shè)計)人: | 王寶巖;姜軍;王昕;張劍;張衛(wèi) | 申請(專利權(quán))人: | 北京大學(xué)深圳研究院;深圳報業(yè)集團;深圳新聞網(wǎng)傳媒股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04 |
| 代理公司: | 廣州華進聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 謝曲曲 |
| 地址: | 518000 廣東省深圳市高新*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 情感 分析 方法 裝置 存儲 介質(zhì) 計算機 設(shè)備 | ||
本發(fā)明涉及一種文本情感分析方法、裝置、存儲介質(zhì)和計算機設(shè)備。獲取測試文本中句子的句向量,句向量是由句子中的詞的詞向量連接構(gòu)成,將句向量分別輸入到預(yù)設(shè)的兩個卷積神經(jīng)網(wǎng)絡(luò)和一個雙向長短期記憶神經(jīng)網(wǎng)絡(luò)模型進行處理得到句子的三個句子特征向量。將三個句子特征向量連接,通過分類器SVM對連接后的句子特征向量進行分類得到句子的情感分類結(jié)果,根據(jù)句子的情感分類結(jié)果得到測試文本的情感傾向。該方法結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)能夠有效的提取局部特征、雙向長短時記憶神經(jīng)網(wǎng)絡(luò)能夠有效地分析時序特征的優(yōu)勢,通過該方法對測試文本經(jīng)過情感分析后獲取的情感傾向更高的魯棒性和泛化能力,且更加高效。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,特別是涉及一種文本情感分析方法、裝置、存儲介質(zhì)和計算機設(shè)備。
背景技術(shù)
對文本情感數(shù)據(jù)進行自動化分析一直是人工智能、自然語言處理技術(shù)的一個重要研究及應(yīng)用技術(shù)領(lǐng)域,其主要功能是通過自然語言處理技術(shù)和情感計算技術(shù),自動分析和學(xué)習(xí)文本數(shù)據(jù)中蘊含的情感表達,根據(jù)情感表達將句子分為正面、負面和中性三種類別。
隨著我國綜合國力不斷提高,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等第三產(chǎn)業(yè)逐漸成為經(jīng)濟發(fā)展的最新引擎。在這些應(yīng)用領(lǐng)域里對文本數(shù)據(jù)進行情感分析是推動其發(fā)展進步的重要力量之一,尤其是在輿情管理、商業(yè)決策、大數(shù)據(jù)分析等任務(wù)中發(fā)揮著舉足輕重的作用。例如,在互聯(lián)網(wǎng)輿情分析領(lǐng)域,利用情感分析技術(shù)可以獲知廣大網(wǎng)民對于特定事件的意見與觀點,及時了解民眾的輿論趨勢,正確采取引導(dǎo)行動,實現(xiàn)有效有序的社會管理。在反恐領(lǐng)域,通過對社交媒體上極端情感的分析,可以發(fā)現(xiàn)潛在的恐怖分子。在商業(yè)決策領(lǐng)域,通過對海量用戶評論的情感分析與觀點挖掘,能夠獲取可靠的用戶反饋信息,了解產(chǎn)品優(yōu)缺點,同時深刻理解用戶的真實需求,實現(xiàn)精準(zhǔn)營銷。此外,情感分析還被成功應(yīng)用于股市預(yù)測、票房預(yù)測、選舉結(jié)果預(yù)測等場景中,充分體現(xiàn)了情感分析在各行各業(yè)的巨大作用。
傳統(tǒng)的,文本情感分析方法主要有基于情感詞典、機器學(xué)習(xí)以及深度學(xué)習(xí)等。但是對于需要處理大量文本數(shù)據(jù)的行業(yè)而言,采用傳統(tǒng)的文本情感分析的方法對文本數(shù)據(jù)進行情感分類,不僅準(zhǔn)確度差,而且工作效率也很低。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠提高分析準(zhǔn)確度的文本情感分析方法、裝置、存儲介質(zhì)和計算機設(shè)備。
一種文本情感分析方法,所述方法包括:
獲取測試文本中句子的句向量,所述句向量是由所述句子中的詞的詞向量連接構(gòu)成;
將所述句向量分別輸入到預(yù)設(shè)的兩個卷積神經(jīng)網(wǎng)絡(luò)和一個雙向長短期記憶神經(jīng)網(wǎng)絡(luò)模型進行處理得到所述句子的三個句子特征向量;
將所述三個句子特征向量連接,通過分類器對連接后的句子特征向量進行分類得到所述句子的情感分類結(jié)果;
根據(jù)句子的情感分類結(jié)果得到測試文本的情感傾向。
在其中一個實施例中,所述兩個卷積神經(jīng)網(wǎng)絡(luò)包括:一個卷積核為3的卷積神經(jīng)網(wǎng)絡(luò)和另一個卷積核為5的卷積神經(jīng)網(wǎng)絡(luò)。
在其中一個實施例中,所述將所述句向量分別輸入到預(yù)設(shè)的兩個卷積神經(jīng)網(wǎng)絡(luò)和一個雙向長短期記憶神經(jīng)網(wǎng)絡(luò)進行處理得到三個所述句子的句子特征向量,包括:
將所述句向量分別輸入到預(yù)設(shè)的兩個卷積神經(jīng)網(wǎng)絡(luò)中進行卷積操作,再進行最大池化操作,生成第一句子特征向量;
將所述句向量輸入到預(yù)設(shè)的一個雙向長短期記憶神經(jīng)網(wǎng)絡(luò)計算出第二句子特征向量,再將第二句子特征向量一維化。
在其中一個實施例中,所述方法還包括:
對用于建模的文本進行預(yù)處理,對預(yù)處理后的文本中的句子進行人工情感標(biāo)注,得到句子的情感分類結(jié)果;
將用于建模的文本根據(jù)預(yù)先訓(xùn)練的詞向量集合得到句子的句向量,所述句向量是由所述句子中的詞的詞向量連接構(gòu)成;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué)深圳研究院;深圳報業(yè)集團;深圳新聞網(wǎng)傳媒股份有限公司,未經(jīng)北京大學(xué)深圳研究院;深圳報業(yè)集團;深圳新聞網(wǎng)傳媒股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710620545.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





