[發明專利]一種基于深度學習的方面級情感分析方法及系統有效
| 申請號: | 202011630698.7 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112667816B | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | 何婷婷;何軍;王逾凡;范瑞;薛昊 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 嚴彥 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 方面 情感 分析 方法 系統 | ||
1.一種基于深度學習的方面級情感分析方法,其特征在于:用情感分析語料訓練基于區間特征的方面級情感三元提取模型SUM-ASTE,所述基于區間特征的方面級情感三元提取模型SUM-ASTE包括雙層的雙向長短期記憶網絡BiLSTM,然后用訓練后的基于區間特征的方面級情感三元提取模型SUM-ASTE,識別文本包含的情感信息,得到文本的方面詞A、觀點詞O和情感極性E;訓練基于區間特征的方面級情感三元提取模型SUM-ASTE的實現過程包括以下步驟,
步驟1,將文本U作為輸入,通過第一層BiLSTM模型得到輸入文本中每個詞的表示H1,根據H1計算得到文本中的方面詞A;
步驟2,將H1做為第二層BiLSTM的輸入,根據第二層BiLSTM模型輸出H2、方面詞特征T和方面詞A與每個詞之間的相對距離信息p,融合得到方面詞對應的觀點詞O;
步驟3,根據第二層BiLSTM模型的輸出H2與觀點詞的注意力特征信息attk,計算得到方面詞對應的情感極性E;
步驟1的實現過程如下,
在情感分析的文本中,將文本U進行分詞后得到長度為N的輸入文本I=[x1,x2,...,xN],然后使用詞嵌入技術得到其相應的詞向量序列e=[e1,e2,...,eN],ei表示第i個詞xi的詞向量,i=1,2,…,N;
將詞向量e輸入第一層BiLSTM模型,得到文本中每個詞特征表示表示第一層BLSTM的第i個輸出;
通過對進行激活函數處理,計算得到方面詞的概率分布選取最大概率的詞作為文本U中的方面詞Ai,得到文本U中的方面詞A=[A1,A2,...,Am],m表示文本U方面詞的個數;
步驟2的實現過程如下,
1)將第一層BiLSTM的輸出狀態H1作為第二層BiLSTM的輸入,通過計算得到第二層網絡狀的態輸出表示第二層BLSTM的第i個輸出;
根據步驟1得到的方面詞,計算方面詞的開始與結束位置上的狀態平均值作為方面詞的特征表示tk,文本中所有的方面詞特征表示為T=[t1,t2…,tm],k=1,2,…,m;
2)獲取方面詞的相對距離特征,使用詞嵌入技術將常數相對距離位置dk,i映射得到特征向量pk,i;
3)融合方面詞特征、第二層BiLSTM文本輸出詞特征和方面詞與每個詞的相對距離特征,融合得到方面詞對應的觀點詞O;
融合得到方面詞對應的觀點詞O的實現過程如下,
其中,tk表示第k個方面詞特征,表示第i個詞在第二層BiLSTM輸出特征,pk,i表示第k個方面詞與第i個詞之間的相對距離,通過三者相加得到第k個方面詞對應的第i個詞的觀點狀態表示WO代表是全連接網絡層的能夠訓練的參數,softmax表示激活函數,使用帶softmax激活函數的全連接網絡層計算隱狀態計算得到第i個詞是第k個方面詞對應觀點詞的概率分布選取最大概率的詞作為第k個方面詞對應的觀點詞O。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011630698.7/1.html,轉載請聲明來源鉆瓜專利網。





