[發明專利]一種基于雙向交互神經網絡的文本情感分析方法在審
| 申請號: | 201811257439.7 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109522548A | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 張立鵬;顧淑琴;張鵬 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/35 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 劉玥 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 文本情感 雙向交互 測試集 多模態 文本詞 向量 語料 概率 預處理 情感分類模型 神經網絡模型 相對位置信息 加權融合 決策融合 情感分類 圖像預測 文本預測 訓練語料 詞向量 訓練集 構建 量子 句子 樣本 分析 搜集 文本 智能 預測 全局 | ||
1.一種基于雙向交互神經網絡的文本情感分析方法,其特征在于:它包括如下步驟:
(1):構建一個實體-文本情感語料集,該語料集的總樣本數為N,其中每條樣本包含一段文本和一個實體詞;
(2):從(1)的實體-文本情感語料集中,隨機選取80%*N個樣本作為訓練集,10%*N個樣本劃分為驗證集和剩余的10%*N個樣本劃分為測試集,并分別對訓練集、驗證集和測試集進行預處理;
(3):對預處理之后的文本和實體詞,構建神經網絡模型框架;根據實體詞在文本中的位置構造文本中每個詞的相對位置信息特征,并輸入到一個雙向交互的神經網絡模型中;運用方法如下:
3.1:根據實體詞的位置構造文本中每個詞的相對位置索引,假設一個實體詞出現在句子中,那么它的位置索引將被標記為“0”,而句子中的其他詞的位置索引將被表示為與當前實體詞的相對距離;
其中js和je分別代表實體詞在句子中的起始和結束位置索引,pi可以被看作是句子中第i個詞關于實體詞的相對位置索引;
3.2:運用glove工具得到每個文本中單詞的詞向量wi,同時建立一個位置信息的矩陣,每一個相對位置索引對應一個向量pi;所述文本中的每個詞的表示xi=concat(wi,pi),以及實體詞的表示ei=wi;
3.3本的每個詞的詞向量連同它的相對位置信息向量按其在句子中的順序輸入到一個雙向長短期記憶網絡中,同時把實體詞本身也輸入到另一個雙向長短期記憶網絡網絡中;
其中,f代表遺忘門,i代表輸入門,o代表輸出門,σ代表sigmoid函數,W和b分別代表權重和偏置;其中,雙向的LSTM網絡分為forward(前向)和backward(后向),通過用上述的公式,輸入每個詞的表示xt(或實體詞表示et),分別得到前向和后向的網絡隱層狀態表示和最后拼接兩個隱層狀態表示以得到對于實體詞,以相同的方式得到隱層狀態表示
3.4:根據上一步中得到的文本中每個詞的網絡隱層狀態表示,和實體中每個詞的網絡隱層狀態表示,計算基于雙向注意力機制的交互信息;具體如下,
3.41實體到文本的注意力計算:
其中αij表示從實體中第i個詞到句子中第j個詞的注意力權重,W和b分別代表權重矩陣和偏置項;
3.4文本到實體的注意力計算:
其中γi表示從句子表示到實體中第i個詞的注意力權重,代表文本句子隱層狀態表示的平均池化;
3.5:將最終的文本表示hR輸入到一個非線性全連接神經網絡層得到神經網絡表示向量x,再將表示x輸入到softmax分類層輸出最終的類別y;
x=tanh(WRhR+bR)
y=softmax(Wsx+bs)
(4):定義(3)中的神經網絡模型損失函數為:
其中yi代表真是類別標簽,代表預測結果,λ代表正則化系數,θ代表模型中所有的參數;
(5):在訓練集上訓練神經網絡模型,每間隔一定批次,在驗證集上進行驗證神經網絡模型效果,記錄保存在驗證集上效果達到最優時的神經網絡模型參數;
(6):用上一步中保存的最優的神經網絡模型模型去測試測試集上的樣本,最終得到每個測試樣本的預測結果,對比測試標簽,計算出分類準確率。
2.根據權利要求1所述的一種基于雙向交互神經網絡的文本情感分析方法,其特征在于,實體-文本情感語料集是由文本和對應的實體組成的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811257439.7/1.html,轉載請聲明來源鉆瓜專利網。





