[發明專利]一種文本情感識別方法、裝置、存儲介質及電子設備在審
| 申請號: | 202010480654.4 | 申請日: | 2020-05-30 |
| 公開(公告)號: | CN111898384A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 王曉悅;馬行空;劉冰;王勇軍;李軍;解培岱;許方亮;石浩辛;陳科;江金壽;田建輝;葉金華;何圣華 | 申請(專利權)人: | 中國兵器科學研究院 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/151;G06N3/04;G06N3/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 王寧寧 |
| 地址: | 100089 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 識別 方法 裝置 存儲 介質 電子設備 | ||
本申請提供一種文本情感識別方法、裝置、存儲介質及電子設備,涉及文本情感分析技術領域。其中,文本情感識別方法包括如下步驟:獲取針對指定事件的目標數據信息;所述目標數據信息中包括文本數據和表情符號;分別確定所述文本數據的各個目標分詞的詞向量和所述表情符號的表情詞向量;結合各個目標分詞的詞向量和所述表情符號的表情詞向量,確定所述目標數據信息所屬的情感類別。該方法綜合考慮文本數據和表情符號表達的情感特征,可以有效提升情感分析的準確率。
技術領域
本申請涉及文本情感分析技術領域,尤其涉及一種文本情感識別方法、裝置、存儲介質及電子設備。
背景技術
隨著社交網絡的快速發展,越來越多的人通過社交網絡對社會事件、產品、服務等發表評論、表達觀點。在實際應用中,新產品或服務上線后,商家需要利用社交網絡數據分析用戶的喜好和態度,進而判斷產品或服務的優劣并進行改進;新政策或法規頒布后,政府部門需要利用社交網絡數據分析人群的情感傾向,為后續政策或法規完善提供依據;熱點事件爆發后,相關職能部門或公共服務部門需要利用社交網絡數據分析人群的態度傾向,進而為輿論正確引導提供技術支撐。因此,利用海量社交網絡數據開展情感分析技術研究具有重要意義。
當前,社交網絡數據呈現出以下兩個特點:一是文本簡短,以Weibo、Twitter為代表的社交網絡平臺,單條博文的字數有限,提高了分析挖掘的難度。二是文本中大量使用表情符號,一方面表情符號對文本內容語義具有補充、增強等作用,另一方面表情符號增加了語言的生動性?;谏缃痪W絡數據的上述特點,采用傳統的文本分析方法對社交網絡數據進行情感分析時,得到的情感分析結果的準確性較低。
發明內容
本申請實施例提供一種文本情感識別方法、裝置、存儲介質及電子設備,可以有效提升情感分析的準確率。
為達到上述目的,本申請實施例的技術方案是這樣實現的:
第一方面,本申請實施例提供文本情感識別方法,包括:
獲取針對指定事件的目標數據信息;所述目標數據信息中包括文本數據和表情符號;
分別確定所述文本數據的各個目標分詞的詞向量和所述表情符號的表情詞向量;
結合各個目標分詞的詞向量和所述表情符號的表情詞向量,確定所述目標數據信息所屬的情感類別。
在一種可選的實施例中,確定所述文本數據的各個目標分詞的詞向量,包括:
對所述文本數據進行分詞處理,根據得到的分詞確定文本數據的各個目標分詞;
采用詞向量模型將各個目標分詞轉換為詞向量。
在一種可選的實施例中,所述根據得到的分詞確定文本數據的各個目標分詞,包括:
去除得到的分詞中的停用詞,將剩余的分詞作為目標分詞;或者,
根據得到的每個分詞在所述文本數據中的重要度,去除部分分詞,將剩余的分詞作為目標分詞;
若得到的目標分詞少于設定數量,采用目標分詞的同義詞將目標分詞擴充至設定數量。
在一種可選的實施例中,確定所述表情符號的表情詞向量,包括:
獲取所述表情符號對應的語義關鍵詞以及各個語義關鍵詞對應的權重;
根據各個語義關鍵詞對應的權重,將各個語義關鍵詞的詞向量進行加權求和,得到所述表情符號的表情詞向量。
在一種可選的實施例中,結合各個目標分詞的詞向量和所述表情符號的表情詞向量,確定所述目標數據信息所屬的情感類別,包括:
將各個目標分詞的詞向量和所述表情符號的表情詞向量進行融合,得到所述目標數據信息對應的特征矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國兵器科學研究院,未經中國兵器科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010480654.4/2.html,轉載請聲明來源鉆瓜專利網。





