[發明專利]一種文本情感識別方法、裝置、存儲介質及電子設備在審
| 申請號: | 202010480654.4 | 申請日: | 2020-05-30 |
| 公開(公告)號: | CN111898384A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 王曉悅;馬行空;劉冰;王勇軍;李軍;解培岱;許方亮;石浩辛;陳科;江金壽;田建輝;葉金華;何圣華 | 申請(專利權)人: | 中國兵器科學研究院 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/151;G06N3/04;G06N3/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 王寧寧 |
| 地址: | 100089 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 識別 方法 裝置 存儲 介質 電子設備 | ||
1.一種文本情感識別方法,其特征在于,包括:
獲取針對指定事件的目標數據信息;所述目標數據信息中包括文本數據和表情符號;
分別確定所述文本數據的各個目標分詞的詞向量和所述表情符號的表情詞向量;
結合各個目標分詞的詞向量和所述表情符號的表情詞向量,確定所述目標數據信息所屬的情感類別。
2.根據權利要求1所述的方法,其特征在于,確定所述文本數據的各個目標分詞的詞向量,包括:
對所述文本數據進行分詞處理,根據得到的分詞確定文本數據的各個目標分詞;
采用詞向量模型將各個目標分詞轉換為詞向量。
3.根據權利要求2所述的方法,其特征在于,所述根據得到的分詞確定文本數據的各個目標分詞,包括:
去除得到的分詞中的停用詞,將剩余的分詞作為目標分詞;或者,
根據得到的每個分詞在所述文本數據中的重要度,去除部分分詞,將剩余的分詞作為目標分詞;
若得到的目標分詞少于設定數量,采用目標分詞的同義詞將目標分詞擴充至設定數量。
4.根據權利要求1所述的方法,其特征在于,確定所述表情符號的表情詞向量,包括:
獲取所述表情符號對應的語義關鍵詞以及各個語義關鍵詞對應的權重;
根據各個語義關鍵詞對應的權重,將各個語義關鍵詞的詞向量進行加權求和,得到所述表情符號的表情詞向量。
5.根據權利要求1所述的方法,其特征在于,結合各個目標分詞的詞向量和所述表情符號的表情詞向量,確定所述目標數據信息所屬的情感類別,包括:
將各個目標分詞的詞向量和所述表情符號的表情詞向量進行融合,得到所述目標數據信息對應的特征矩陣;
根據所述目標數據信息對應的特征矩陣,確定所述目標數據信息所屬的情感類別。
6.根據權利要求1所述的方法,其特征在于,結合各個目標分詞的詞向量和所述表情符號的表情詞向量,確定所述目標數據信息所屬的情感類別,包括:
將各個目標分詞的詞向量和所述表情符號的表情詞向量輸入已訓練的卷積神經網絡模型,得到所述卷積神經網絡模型輸出的所述目標數據信息所屬的情感類別;所述卷積神經網絡模型包括輸入層、卷積層、池化層和全連接層,所述輸入層用于將各個目標分詞的詞向量和所述表情符號的表情詞向量進行融合,得到所述目標數據信息對應的特征矩陣,所述卷積層用于對得到的特征矩陣進行特征提取,得到特征圖,所述池化層用于對得到的特征圖進行池化處理,得到優化特征圖,所述全連接層用于根據所述優化特征圖確定所述目標數據信息所屬的情感類別。
7.根據權利要求6所述的方法,其特征在于,所述卷積神經網絡模型的訓練過程,包括:
獲取針對指定事件的訓練數據集,所述訓練數據集中包括多個樣本數據信息,每個樣本數據信息均包括樣本文本數據和樣本表情符號,且每個樣本數據信息具有預先標注的情感類別標簽;
從所述訓練數據集中抽取樣本數據信息,分別確定抽取的樣本數據信息的樣本文本數據中的各個樣本分詞的詞向量和樣本表情符號的表情詞向量;
將各個樣本分詞的詞向量和樣本表情符號的表情詞向量輸入待訓練的卷積神經網絡模型,得到卷積神經網絡模型輸出的樣本數據信息所屬的情感類別;
根據樣本數據信息所屬的情感類別與預先標注的樣本數據信息的情感類別標簽,確定損失值;
根據損失值對卷積神經網絡模型的參數進行調整,直至所述損失值收斂至預設的期望值為止,得到已訓練的卷積神經網絡模型。
8.一種文本情感分析裝置,其特征在于,包括:
信息獲取單元,用于獲取針對指定事件的目標數據信息;所述目標數據信息中包括文本數據和表情符號;
信息處理單元,用于分別確定所述文本數據的各個目標分詞的詞向量和所述表情符號的表情詞向量;
情感類別確定單元,用于結合各個目標分詞的詞向量和所述表情符號的表情詞向量,確定所述目標數據信息所屬的情感類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國兵器科學研究院,未經中國兵器科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010480654.4/1.html,轉載請聲明來源鉆瓜專利網。





