[發明專利]一種文本情感分析處理方法和系統在審
| 申請號: | 201710313628.0 | 申請日: | 2017-05-05 |
| 公開(公告)號: | CN107247702A | 公開(公告)日: | 2017-10-13 |
| 發明(設計)人: | 黃文明;杜夢豪;孫曉潔;衛萬成 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06N3/04 |
| 代理公司: | 北京輕創知識產權代理有限公司11212 | 代理人: | 楊立,周玉婷 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 分析 處理 方法 系統 | ||
1.一種文本情感分析處理方法,適于在計算設備中執行,其特征在于,包括如下步驟:
步驟S1:根據分詞工具將采集的文本進行分詞處理,得到文本分詞;
步驟S2:根據詞向量工具將得到的文本分詞進行詞向量訓練,得到文本分詞的二進制文件,所述二進制文件中包括文本分詞的詞向量;
步驟S3:根據依存句法分析方法從所述二進制文件中提取情感特征詞組,并從情感特征詞組中獲取句法特征信息,并根據情感詞典獲取所述情感特征詞組的情感特征信息;
步驟S4:將所述句法特征信息和情感特征信息進行特征融合,得到含有句法及情感信息的文本特征;
步驟S5:將所述二進制文件中的詞向量與所述情感特征信息進行融合,得到含有情感信息的詞向量;
步驟S6:建立卷積神經網絡,通過卷積神經網絡對所述含有情感信息的詞向量進行提取,得到含有情感信息的語義特征;
步驟S7:通過卷積神經網絡將所述含有句法及情感信息的文本特征與所述含有情感信息的語義特征進行融合,從而得到文本的語法信息、語義信息、句法信息和情感信息。
2.根據權利要求1所述一種文本情感分析處理方法,其特征在于,所述步驟S1前還包括步驟:對采集的文本進行歸一化處理,將文本中的非文本符號刪除,得到歸一化處理后的文本;所述非文本符號包括語言標識、字母、數字和非文本表情符號。
3.根據權利要求2所述一種文本情感分析處理方法,其特征在于,所述步驟S1具體包括:采用分詞工具HanLP對歸一化處理后的文本進行分詞處理,再根據停用詞詞表在分詞處理得到的文本中進行停用詞刪除處理,得到刪除停用詞的文本分詞。
4.根據權利要求1所述一種文本情感分析處理方法,其特征在于,所述步驟S2具體為:根據Word2vec模型框架將得到的文本分詞進行詞向量訓練,得到文本分詞的二進制文件,所述二進制文件中包括文本分詞的詞向量。
5.根據權利要求4所述一種文本情感分析處理方法,其特征在于,所述Word2vec模型框架包括Skip-gram模型,
所述Skip-gram模型用于計算文本分詞的詞向量的條件概率,得到最大后驗概率的文本分詞,將最大后驗概率的文本分詞進行詞向量訓練,得到文本分詞的二進制文件,所述二進制文件中包括文本分詞的詞向量。
6.根據權利要求4所述一種文本情感分析處理方法,其特征在于,所述步驟S4具體包括:根據SOAD算法計算情感特征信息的情感值,將所述句法特征信息的向量詞與所述情感值進行融合,得到含有句法及情感信息的文本特征。
7.根據權利要求1所述一種文本情感分析處理方法,其特征在于,所述步驟S6具體為:建立CNN卷積神經網絡,所述CNN卷積神經網絡包括輸入層、卷積層和池化層,
所述輸入層,用于將所述含有情感信息的詞向量輸入CNN卷積神經網絡中;
所述卷積層,用于將輸入的所述含有情感信息的詞向量進行卷積處理,得到含有情感信息的語義特征;
所述池化層,用于獲取所述含有情感信息的語義特征的特征值,對所述特征值進行降采樣,得到具有相同維度的所述含有情感信息的語義特征。
8.根據權利要求7所述一種文本情感分析處理方法,其特征在于,所述步驟S7具體為:所述CNN卷積神經網絡還包括全連接層,
所述全連接層,用于將所述含有句法及情感信息的文本特征與所述含有情感信息的語義特征進行全連接,得到文本的語法信息、語義信息、句法信息和情感信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710313628.0/1.html,轉載請聲明來源鉆瓜專利網。





