[發明專利]一種基于深度學習的文本細粒度情感分析算法有效
| 申請號: | 202011027335.4 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112256866B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 韓東紅;朱帥偉;李婧;吳剛;喬百友 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06F40/211;G06F40/242;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 廣東有知貓知識產權代理有限公司 44681 | 代理人: | 王臻巍 |
| 地址: | 110004 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 文本 細粒度 情感 分析 算法 | ||
本發明提供了一種基于深度學習的文本細粒度情感分析方法,包括如下步驟:基于輔助學習和注意力機制的AL?ATT模型和基于圖卷積網絡與注意力機制的GCN?ATT模型;基于輔助學習和注意力機制的AL?ATT模型包括如下步驟:數據預處理—注意力嵌入模塊—輔助學習模塊—交互注意力模塊—輸出模塊—正則化約束;相比于依賴語言學知識和人工特征提取的基于規則和機器學習方法,使用深度學習不需要人工的選擇特征也不需要依賴大量的特征工程,它可以很好的處理高維的輸入數據,可以自動學習文本中的特征,從而對文本向量實現進行準確的分類。
技術領域
本發明涉及自然語言處理中檢測文本目標實體情感極性領域,尤其涉及一種基于深度學習的文本細粒度情感分析算法。
背景技術
現今社會,網絡越來越便利,移動端越來越普及,各大社交網絡平臺蓬勃發展,人們愿意隨時隨地在各大平臺上發表自己對于某件事的觀點,表達自己情緒,這使社交網絡上積累了大量的情感數據。較為活躍的社交平臺包括國內的貼吧,論壇,朋友圈,微博,國外的Twitter,Instagram,Facebook等等。隨著這些網絡文本評論數據的不斷增加,這些內容包含大量的有用的信息,通過對這些信息進行主觀的情感分析,在諸多領域,例如輿情分析、推薦系統、電子商務等有相當大意義,文本情感分析基于處理文本的粒度不同,可以分為篇章級、段落級、句子級、短語級、詞語級等幾個層次,當前的情感分析研究大多是粗粒度的,即模型只得出一個整體的情感極性,然而,隨著文本內容的復雜性和用戶的需求逐漸增加,粗粒度的情感分析已不能滿足社會需求;
文本細粒度情感分析,又稱特定目標或情感實體的情感分析,旨在識別每個句子中各個目標或情感實體的情感極性,如“這個筆記本電腦CPU性能很強,但是屏幕分辨率不是很好”這條評論,對于情感實體“CPU”的情感極性是積極的,而對情感實體“屏幕分辨率”的情感極性是消極的,對于這樣的文本,如果使用粗粒度情感分析,可能會得到中性情感的結論,這沒有任何參考價值,甚至會對用戶產生誤導,所以,細粒度情感分析有著重要意義,在電子商務領域,可以通過用戶對商品各個方面的評論信息進行情感分析,給其他用戶提供一個參考依據,此外,廠家也可通過情感分析所得信息對商品進行針對性改進,得到更好的收益,在輿情分析方面,政府可以通過對網絡平臺上用戶討論的熱門話題進行情感分析,了解民眾反應,有利于政府做出應對措施。
現有技術的問題:細粒度情感分析在電子商務,輿情分析,心理健康等領域有著重要的理論和應用價值,在現有的基于深度學習的細粒度情感分析研究中,仍存在難以充分挖掘與情感實體情感極性相關的信息、忽略句子中各個情感實體之間的聯系等問題。
發明內容
本發明的目的在于提供一種基于深度學習的文本細粒度情感分析算法,以解決上述技術問題。
本發明為解決上述技術問題,采用以下技術方案來實現:
一種基于深度學習的文本細粒度情感分析算法,其特征在于:包括如下步驟:基于輔助學習和注意力機制的AL-ATT模型和基于圖卷積網絡與注意力機制的GCN-ATT模型;
基于輔助學習和注意力機制的AL-ATT模型包括如下步驟:數據預處理-注意力嵌入模塊-輔助學習模塊-交互注意力模塊-輸出模塊-正則化約束;
基于圖卷積網絡與注意力機制的GCN-ATT模型包括如下步驟:數據預處理-輸入嵌入Bi-GRU模塊-注意力嵌入模塊-圖卷積網絡模塊-輸出模塊與正則化約束;
輔助學習模塊包括以下步驟:
S1、先將上下文或者目標項的詞性映射為詞性向量epos,并通過Glove預訓練模型得到的詞向量eG,將兩者拼接得到i=[epos;eG]作為輔助學習層的輸入;
S2、將i輸入到Bi-LSTM中得到前向隱含向量和后向隱含向量將和拼接得到最后的上下文隱含表示
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011027335.4/2.html,轉載請聲明來源鉆瓜專利網。





