[發明專利]一種文本情感分析方法、裝置、電子設備及存儲介質有效
| 申請號: | 202110571174.3 | 申請日: | 2021-05-25 |
| 公開(公告)號: | CN113221534B | 公開(公告)日: | 2023-06-16 |
| 發明(設計)人: | 黃文清 | 申請(專利權)人: | 深圳和銳網絡科技有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/242;G06F40/284;G06F40/289 |
| 代理公司: | 深圳驛航知識產權代理事務所(普通合伙) 44605 | 代理人: | 楊倫 |
| 地址: | 518000 廣東省深圳市寶安*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 分析 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供一種文本情感分析方法、裝置、電子設備及存儲介質,所述方法包括:獲取文本數據并進行預處理;對所述預處理后的文本數據進行分詞處理和分字處理,并將處理結果分別輸入預訓練的詞轉向量模型,得到詞向量和字向量;基于所述詞向量和所述字向量獲取第一情感方向和第二情感方向;將所述詞向量和所述字向量進行融合,得到融合向量,并基于所述融合向量得到第三情感方向;基于所述第一情感方向、第二情感方向和第三情感方向確定文本的情感傾向。可以全面地、細粒度地利用文本情感數據,提高文本情感分析的準確率。
技術領域
本發明涉及計算機情感分析技術領域,尤其涉及一種文本情感分析方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網、特別是移動互聯網的迅速發展,各種新應用不斷產生,例如新聞門戶網站、電子商務網站、社交網絡等。在這些應用上,普通大眾可以表達對事物的主觀傾向性觀點,例如對新聞事件的評論,以及對所購買商品的喜好。目前,由用戶生成的帶有情感傾向性的文本數據以指數增長。通過挖掘這些海量數據,獲取用戶情感信息,對電子商務、商業智能、民意調查、輿情分析、情報分析、企業管理等至關重要,也為管理者提供強有力的決策支持。例如,商家可以通過這些信息獲取消費者意見,更好地理解消費者的喜好與消費習慣,設計生產出更有針對性的產品;政府機構可以通過分析熱點事件的輿情,為指定方針政策提供依據;而普通消費者則可以依據其他人的觀點匯總作為其購買行為以及消費決策的重要參考。
當前現有技術常見的情感分析方法,文本信息的獲取和構建不全面,數據量不夠大,且是基于句子級別的粗粒度的情感分析方法,對文本上下文信息的表示和利用也存在差距,難以細粒度辨別上下文情感信息,導致情感分析不夠準確。
發明內容
本發明實施例提供一種文本情感分析方法,能夠提高文本情感分析的準確度。
第一方面,本發明實施例提供一種文本情感分析方法,包括以下步驟:
獲取文本數據并進行預處理;
對所述預處理后的文本數據進行分詞處理和分字處理,并將處理結果分別輸入預訓練的詞轉向量模型,得到詞向量和字向量;
基于所述詞向量和所述字向量獲取第一情感方向和第二情感方向;
將所述詞向量和所述字向量進行融合,得到融合向量,并基于所述融合向量得到第三情感方向;
基于所述第一情感方向、第二情感方向和第三情感方向確定文本的情感傾向。
可選的,所述獲取文本數據并進行預處理,包括:
通過爬蟲從互聯網上獲取文本數據;
對所述文本數據進行去重處理。
可選的,所述對所述預處理后的文本數據進行分詞處理和分字處理,包括:
將所述預處理后的文本數據輸入到大數據處理平臺進行分詞處理和分字處理,得到分詞處理結果和分字處理結果。
可選的,所述詞轉向量模型包括CBOW結構的word2vec模型,所述將處理結果分別輸入預訓練的詞轉向量模型,得到詞向量和字向量,包括:
獲取所述CBOW結構的word2vec模型的詞窗;
調整所述詞窗大小,并通過所述詞窗分別將所述分詞處理結果和分字處理結果輸入所述CBOW結構的word2vec模型,對應得到所述詞向量和所述字向量。
可選的,基于所述詞向量和所述字向量獲取第一情感方向和第二情感方向的步驟包括:
獲取情感分析詞典;
根據所述情感分析詞典從所述詞向量和所述字向量中分別獲取對應的第一情感方向和第二情感方向。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳和銳網絡科技有限公司,未經深圳和銳網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110571174.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電動叉車貨叉能效在線監測系統
- 下一篇:一種水性吸塑膠及其制備方法





