[發明專利]一種基于多通道模型的特定目標情感分析方法有效
| 申請號: | 201811291881.1 | 申請日: | 2018-10-31 |
| 公開(公告)號: | CN109408823B | 公開(公告)日: | 2019-08-06 |
| 發明(設計)人: | 袁婷;黎海輝;薛云;胡曉暉 | 申請(專利權)人: | 華南師范大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/35;G06Q30/02 |
| 代理公司: | 廣州市科豐知識產權代理事務所(普通合伙) 44467 | 代理人: | 王海曼 |
| 地址: | 510000 廣東省廣州市天河區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 注意力機制 情感分析 預處理 情感分類 測試集 多通道 目標詞 數據集 向量 自然語言處理技術 分類準確率 方法設置 分類結果 獲取目標 歐式距離 評論文本 情感計算 特征提取 訓練集 池化 分層 標簽 測試 學習 | ||
本發明公開了一種基于多通道模型的特定目標情感分析方法,旨在提供一種特定目標情感分析方法,將目標詞與上下文充分利用起來,本方法設置了三個通道,分別利用分層池化、交互注意力機制、基于歐式距離的注意力機制獲取目標詞和上下文的表示。通過三個通道,目標詞和上下文可以學習到有助于情感分類的表示;其技術方案:(1)輸入SemEval2014數據集,對數據集進行預處理并劃分成訓練集、測試集;(2)預處理后的數據分別輸入到三個通道,進行特征提取以獲得向量r1、r2、r3、r4和r5;(3)利用向量r1、r2、r3、r4和r5,通過注意力機制的學習,得到分類結果;(4)用訓練好的模型對測試集中每個評論文本的特定目標進行情感分類,并與測試集本身的標簽對比,以計算分類準確率;屬于自然語言處理技術與情感計算領域。
技術領域
本發明屬于自然語言處理技術與情感計算領域,具體地說是一種基于多通道深度學習模型的英文特定目標情感分析方法。
背景技術
隨著電子商務行業的發展,網絡購物越來越受到人們的認可,由此也產生了大量的網絡評論文本數據。面對這些海量的網絡評論,一方面消費者需要快速了解評論的情感傾向,從其他消費者的經驗中得到對該物品的評價信息,優化自己的購買決策;另一方面商家也需要從消費者的網絡評論情感傾向中總結得到商品的市場反饋信息,對商品進行改善。因此,如何對評論文本進行情感分類已經成為自然語言處理領域的一個重要研究課題。
傳統的情感分類主要是為了得到句子的整體的情感傾向,當句子中含有多個目標詞的時候,傳統的情感分類的方法就忽略了具體每一個目標詞的情感。因此對特定目標詞的情感分析任務正逐漸被學術界所重視。對特定目標詞的情感分類指的是當一個句子中含有多個目標詞的時候,需要對不同的目標詞進行情感傾向的判斷。例如:The appetizersis ok,but the service is slow and the environment is bad.在這段評價中,通過分析知道,這段評論主要對三個方面進行了評價,分別是開胃菜,服務和環境。這三個目標詞的情感傾向分別是積極,消極和消極。因此傳統的情感分類面對這種多目標詞的情況就顯得不太適用。
情感分類方法主要經歷了三個階段,第一階段是基于詞典和語言學規則的情感分類方法,這種分類方法本質上依賴于情感詞典和判斷規則的質量,需要人工設計,因此這類方法的優劣很大程度上都取決于人工設計和先驗知識。在網絡迅速發展的今天,出現了很多新詞語,如:給力、坑爹,這使得詞典需要實時的更新,即便如此也很難跟上時代的發展,因此基于詞典的方法變得不再實用。第二階段是基于機器學習的情感分類方法,其核心是特征提取和分類器設計,常用的特征工程包括:句法特征,(term frequency–inversedocument frequency,TF-IDF)特征等;常見的分類器有決策樹、貝葉斯分類器、支持向量機等。然而這些傳統的情感分析方法都高度依賴于所獲得的特征質量,并且特征工程的工作量也十分巨大,所以顯得不太適用。因此基于深度學習的方法應運而生,深度學習的方法首先通過海量的樣本學習到詞的表示即詞向量,之后將詞向量作為神經網絡的輸入,經過多層網絡提取出特征,最后通過全連接得到分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南師范大學,未經華南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811291881.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種跨語言圖書相關度分析方法及系統
- 下一篇:用于生成信息的方法和裝置





