[發明專利]一種基于概率情感詞典的情感分析系統及方法有效
| 申請號: | 202010781151.0 | 申請日: | 2020-08-06 |
| 公開(公告)號: | CN111859925B | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 信俊昌;王之瓊;王司亓;隋玲;唐俊日;雷盛楠;汪宇;李嘉欣 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06F40/242 | 分類號: | G06F40/242;G06F40/289;G06N3/0464;G06V20/40;G06V10/774;G06V40/16;G06V10/80;G06V10/82 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 概率 情感 詞典 分析 系統 方法 | ||
本發明公開一種基于概率情感詞典的情感分析系統及方法,屬于計算機自然語言處理技術領域。本發明在基于文本構建情感詞典的基礎上,提出基于文本、圖片、視頻構建的情感詞典。采用深度置信網絡的方式提取圖片上的人臉表情特征來構建圖像情感詞典;采用卷積神經網絡對視頻的情感特征提取,構建視頻情感詞典;采用OpenSMILE進行情感特征提取,構建音頻情感詞典。對于缺失單一模態的情況,通過另外兩種模態的信息特征擬合出缺失模態的特征,還增加反語判斷機制,提高情感分析的準確度并解決在分析過程中某一模態缺失導致分析結果不準確這一問題。
技術領域
本發明涉及計算機自然語言處理技術領域,尤其涉及一種基于概率情感詞典的情感分析系統及方法。
背景技術
情感分析是自然語言處理中常見的場景,主要根據大數據來定性定量分析人類情感,是大數據智能的重要體現。情感分析廣泛應用在輿情監控、客服監控、電商評價等多個領域。例如各種微博評論、視頻網站評價以及電商商品評論等,對于相關部門和人員能夠更好了解用戶情感需求具有關鍵性作用。通過對信息數據的情感分析,可以挖掘出項目產品在各個維度的優劣,從而明確如何改進項目產品。比如對視頻網站的視頻評價分析,可以分析用戶喜好程度、視頻類型以及受眾群眾等多個維度的用戶情感指數,從而從各個維度上改進視頻網站的視頻上架和視頻推廣。目前,情感分析的方法可以采用基于情感詞典的傳統方法,先對文本進行分詞和停用詞處理等預處理,再利用先構建好的情感詞典(一般由正面詞、負面詞、否定詞以及程度副詞等部分構建),對文本進行字符串匹配,將向量詞組匹配到具體的詞典中輸出權值,最后計算總的權值從而分析出目標信息的情感是正面還是負面,同時具體分析出情感達到正面或者負面的那一種程度。也可以采用基于深度學習的情感分類,首先對文本進行分詞、停用詞、簡繁轉換等預處理,然后將分詞結果轉化為詞向量,然后利用相關神經網絡進行特征值提取進行特征提取,最后通過全連接層和Softmax輸出每個分類的概率,從而得到情感分類。
但是,情感分析仍然存在局限性。數據信息擁有視頻、圖片以及文本等多種數據形式,然而大部分的情感分析方法以及目標都是針對文本進行情感分析。因此,現在很多的對數據信息進行情感分析的方法只是將數據中的文本提煉出來對其進行情感分析,都無法適用于多模態數據信息。這導致針對數據的情感分析,無法結合數據中的圖片、視頻以及音頻等相關因素數據信息進行分析。并且在直接影響了情感分析的準確性。
發明內容
針對上述現有技術的不足,本發明提供一種基于概率情感詞典的情感分析系統及方法
為解決上述技術問題,本發明所采取的技術方案是:
一種基于概率情感詞典的情感分析系統,包括:
包括數據層、業務層、接口層和用戶層;
所述數據層存儲對于情感分析算法中所需要使用的不同模態下已標注過情感標簽的訓練集,以及用戶待分析的視頻數據;
所述業務層對數據存儲層的數據進行訓練和分析,包括圖像特征提取模塊、音頻特征提取模塊、文本特征提取模塊和多模態情感分析模塊;所述圖像特征提取模塊提取圖片及從視頻中拆分出來的視頻圖像的特征并存儲;所述音頻特征提取模塊提取從視頻中拆分出來的音頻特征并存儲;所述文本特征提取模塊提取文本信息的特征并存儲;
所述接口層包括待分析視頻輸入接口、情感分析結果可視化接口、應用系統調用接口和web應用調用接口;所述待分析視頻輸入接口將用戶層的待分析視頻傳輸至數據存儲層進行存儲;所述情感分解結果可視化接口將分析結果傳輸至用戶層。
另一方面,本發明還提供采用上述的基于概率情感詞典的情感分析系統進行情感分析的方法,包括如下兩個階段:
第一階段:多模態情感詞典的構建,包括如下步驟:
步驟1:采用已知情感詞典庫,調用已有的第三方網站的文本情感詞典庫構建本系統的文本情感詞典;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010781151.0/2.html,轉載請聲明來源鉆瓜專利網。





