[發明專利]基于BiLSTM的電影評論語義情感分析方法及系統在審
| 申請號: | 202111119024.5 | 申請日: | 2021-09-24 |
| 公開(公告)號: | CN114896386A | 公開(公告)日: | 2022-08-12 |
| 發明(設計)人: | 張晨躍;劉黎志 | 申請(專利權)人: | 武漢工程大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 許美紅 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 bilstm 電影 評論 語義 情感 分析 方法 系統 | ||
本發明公開了一種基于BiLSTM的電影評論語義情感分析方法,通過構建AT?BiLSTM情感分類模型對電影評論文本進行情感分類;該AT?BiLSTM情感分類模型具體包括:向量表示層、BiLSTM層、注意力層、全連接層和分類層,使用歸一化指數函數對融合了注意力機制的電影評論文本進行情感極性的分類。提高電影評論文本情感分類的精確率。本發明利用word2vec模型將電影評論訓練成詞向量的形式,然后在BiLSTM網絡的基礎上加入注意力機制,構建了AT?BiLSTM情感分類模型。該模型可以有效學習電影評論的語義特征,充分提取句子中的關鍵內容,有效提高電影評論的情感分類效果。
技術領域
本發明涉及文本分類技術領域,尤其涉及一種基于BiLSTM的電影評論語義情感分析方法及系統。
背景技術
情感分析也稱為觀點挖掘,是自然語言處理領域的研究熱點,其關鍵任務是分析社交媒體和商品評論的文本數據,進而挖掘出用戶的情感觀點。隨著各種社交網絡平臺的快速發展,越來越多的人喜歡在網絡上發表意見和看法。人們發布的內容不僅包括對熱點問題的討論,還包括對特定商品的評估。例如,通過微博社交平臺獲得用戶對商品以及實時社會熱點問題的關注情感和評論傾向,有利于政府及時進行有效決策。對于電商購物平臺來說,獲取用戶對該平臺商品的情感評論和傾向可以使其知道用戶對該平臺商品的認可程度,從而幫助企業制定正確的營銷方案。因此,挖掘出用戶評論文本信息的情感傾向,能夠讓商家調整策略,及時滿足用戶需求,有巨大的社會意義和龐大的商業價值。
深度學習方法作為機器學習中的一個重要分支,目前已成功應用在計算機視覺、語音識別和自然語言處理(NLP)領域,并取得了重大突破進展。循環神經網絡(RNN)和卷積神經網絡(CNN)是兩種常用的文本處理表示和建模方法。Bi-LSTM是由LSTM演化而來。LSTM是一種特殊的RNN,它的出現解決了RNN的梯度消失或梯度爆炸的問題。word2vec是一群用來產生詞向量的相關模型,其分為CBOW和Skip-gram兩種方式。CBOW模型的訓練輸入是某一個特征詞的上下文相關的詞對應的詞向量,而輸出就是這個特征詞的詞向量。Skip-gram模型和CBOW的思路正好相反,即輸入是一個特征詞的詞向量,而輸出是這個特征詞對應的上下文詞向量。在n元模型中,由于窗口大小的限制,導致超出窗口范圍的詞語與當前詞之間的關系不能被正確地反映到模型之中。如果單純擴大窗口大小又會增加訓練的復雜度。Skip-gram模型可以很好地解決這些問題,該模型包輸入層、映射層和輸出層。
目前,傳統的機器學習和循環神經網絡情感分析方法在電影評論文本上的準確率較低。
發明內容
本發明的目的在于,提供一種基于BiLSTM的電影評論語義情感分析方法及系統,提高對電影評論情感分析的準確率。
本發明所采用的技術方案是:
提供一種基于BiLSTM的電影評論語義情感分析方法,通過構建AT-BiLSTM情感分類模型對電影評論文本進行情感分類;
該AT-BiLSTM情感分類模型具體包括:
向量表示層,利用word2vec預訓練模型對電影評論文本數據進行詞向量表示;
BiLSTM層,將詞向量作為BiLSTM網絡的序列化輸入,定義前向LSTM和后向LSTM,分別從正反方向提取電影評論文本數據的語義特征,并充分學習電影評論上下文的語義信息,得到每個詞的語義特征,并將其作為BiLSTM層的輸出;
注意力層,將BiLSTM層輸出的每個詞的語義特征與注意力機制相融合,增加對電影評論文本中每個詞的關注度;
全連接層和分類層,使用歸一化指數函數對融合了注意力機制的電影評論文本進行情感極性的分類。
接上述技術方案,該方法還包括對該AT-BiLSTM情感分類模型進行訓練的步驟,具體包括:
獲取數據集并進行數據清洗;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢工程大學,未經武漢工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111119024.5/2.html,轉載請聲明來源鉆瓜專利網。





