[發明專利]一種基于深度學習的用戶情感分析方法有效
| 申請號: | 201811565931.0 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN109684636B | 公開(公告)日: | 2023-02-14 |
| 發明(設計)人: | 李祖賀;尚松濤;支俊;馬江濤;楊學東;王鳳琴;于源 | 申請(專利權)人: | 鄭州輕工業學院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/30;G06F40/242;G06F40/284;G06N3/045;G06N3/0442;G06N3/047;G06N3/084 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 450002 *** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 用戶 情感 分析 方法 | ||
本發明公開了一種基于深度學習的用戶情感分析方法,包括以下步驟;構建詞匯表;使用分類器進行分類選中一部分作為種子詞典,并且給出這些種子語料的情感極性得分詞典,改進相應的TF?IDF特征選擇過程;分別將新改進得到的TF?IDF特征詞向量與Word2vec特征詞向量的結果保存起來;對于每種情感分類的情感種子詞語進行加和求平均得到每種情感的中心詞向量的極性的概率。本發明提供了一種基于深度學習的用戶情感分析方法,結合基本的詞頻特征選擇算法,Word2vec算法將文本的詞頻信息,情感信息,語義信息有效的結合起來并且將新構建的情感語義詞向量與原來的詞向量進行了對比試驗,有效的證明了情感語義詞向量的有效性。
技術領域
本發明涉及情感分析技術領域,具體為一種基于深度學習的用戶情感分析方法。
背景技術
互聯網作為人們信息交流與資源共享的平臺,保存了大量含有主觀信息的數據,如何從這些海量的數據中提取出人們的興趣,攜帶觀點的文本,并對其進行情感分類是目前研究的熱點之一;
傳統的用于解決情感分析問題的方法包括基于情感詞典和人工判定規則的無監督方法、基于機器學習的有監督方法,在數據量不大或者語義不夠豐富的時候,這些方法能夠取得一定的效果,但是隨著數據量越來越大、表達方式越來越豐富,傳統的方法已經無法有效地解決這一類問題,新的方法亟待提出。
發明內容
本發明的目的在于提供一種基于深度學習的用戶情感分析方法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:一種基于深度學習的用戶情感分析方法,包括以下步驟;
步驟一、構建詞匯表,將語料庫的文本詞語進行預訓練,根據分析對象的性質構造特征向量獲取模型,并且分別得到對應的TF-IDF和Word2vec特征詞向量;
步驟二、使用分類器進行分類選中一部分作為種子詞典,并且給出這些種子語料的情感極性得分詞典,改進相應的TF-IDF特征選擇過程,得到新的改進的TF-IDF特征選擇詞向量;
步驟三、分別將新改進得到的TF-IDF特征詞向量與Word2vec特征詞向量的結果保存起來;
步驟四、對于每種情感分類的情感種子詞語進行加和求平均得到每種情感的中心詞向量的極性的概率;
S1、對相鄰的每3-5個詞匯的向量相加,取平均值,放入輸入層;
S2、通過使用計算方法產生輸出,采用輸出的最好一個向量作為分類的依據;
S3、通過將softmax層與RNN的輸出進行全連接,獲得情感極性的概率;
步驟五、將得到的概率值與真實值進行比較后,使用交叉熵函數作為損失函數,并且計算損值的大小,然后通過adam算法計算梯度,并用對模型進行參數調整;
步驟六、帶模型進行收斂并導出模型,用于測試集的情感分類;
步驟七、找到每個詞匯對應的詞向量,放入輸入層產生輸出得到各個類別對應的概率值,并使用貪婪算法確定詞匯的類別。
優選的,步驟四中,計算方法為LSTM-RNN的計算方法。
優選的,步驟四中,計算方法為GRU-RNN的計算方法。
優選的,步驟四中,輸入層是表示輸入詞匯量序列,這些向量是通過Word2vec或者隨機詞向量產生。
優選的,步驟五中,使用交叉熵函數作為損失函數時,通過BPTT更新參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州輕工業學院,未經鄭州輕工業學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811565931.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于智能營銷的用戶評價觀點挖掘系統
- 下一篇:一種文本特征的綜合運用方法





