[發明專利]文本情感分析方法、裝置、計算機設備及可讀存儲介質在審
| 申請號: | 202010906464.4 | 申請日: | 2020-09-01 |
| 公開(公告)號: | CN111930896A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 孫思 | 申請(專利權)人: | 平安國際智慧城市科技股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 程超 |
| 地址: | 510000 廣東省深圳市前海深港合*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 情感 分析 方法 裝置 計算機 設備 可讀 存儲 介質 | ||
本發明公開了文本情感分析方法、裝置、計算機設備及可讀存儲介質,涉及情感分析技術領域,包括建立初始模型,采用訓練樣本對所述初始模型進行訓練獲取目標模型;獲取待處理文本,對所述待處理文本進行預處理,獲取第一處理數據;采用所述目標模型對所述第一處理數據進行情感傾向分析和情感數據提取,獲得目標數據,通過目標模型使情感傾向分析與情感數據提取并行處理并在提取后進行雙向調整,區別于現有技術中先分析情感傾向并基于情感傾向提取情感數據的方式,解決了現有技術分步提取的方式中情感數據的獲取依賴于情感傾向,容易誤差傳遞,分析結果的準確率較低的問題。
技術領域
本發明涉及情感分析技術領域,尤其涉及一種文本情感分析方法、裝置、計算機設備及可讀存儲介質。
背景技術
在自然語言處理中,一項重要處理就是情感分析Sentiment Analysis,是指利用自然語言處理和文本挖掘技術,對帶有情感色彩的主觀性文本進行分析、處理和抽取的過程,它在內容分析以及反饋分析中,都占有很高的分析價值,通過分析研究對象的情感分布,可了解輿情,輔助預測等行為。
本發明創造的發明人在研究中發現,當前常見的情感分析方法通常是先對文本做情感類別的分類,然后根據情感的類別,標注出導致該情感類別的文本,由此提取出文本的情感傾向和原因數據,但是這種方式原因數據的獲取依賴于情感傾向,這種分步提取的方式容易誤差傳遞,即當情感傾向有偏差時,則提取的原因數據也會錯誤,由此造成分析結果的準確率較低。
發明內容
本發明的目的是提供一種文本情感分析方法、裝置、計算機設備及可讀存儲介質,用于解決現有技術分步提取的方式中情感數據的獲取依賴于情感傾向,容易誤差傳遞,分析結果的準確率較低的問題。
為實現上述目的,本發明提供一種文本情感分析方法,包括:
建立初始模型,采用訓練樣本對所述初始模型進行訓練獲取目標模型;
獲取待處理文本,對所述待處理文本進行預處理,獲取第一處理數據;
采用所述目標模型對所述第一處理數據進行情感傾向分析和情感數據提取,獲得目標數據。
進一步的,所述采用訓練樣本對所述初始模型進行訓練獲取目標模型,還包括:
采用第一神經網絡對所述訓練樣本進行語義分析,獲得第一分析數據;
基于所述第一分析數據同時采用第一提取網絡和第二提取網絡進行情感傾向提取和情感數據提取,獲得初始情感標簽和初始情感數據;
對所述初始情感標簽和所述初始情感數據進行雙向調整,獲得用于標識情感傾向的第一標簽和用于標識情感數據的第二標簽;
調整第一提取網絡和第二提取網絡的損失權值;
將所述第一標簽與所述第二標簽分別與訓練樣本中的情感傾向標簽和情感數據標簽進行比對,并反向調整所述初始模型中的參數,直至完成訓練,獲得目標模型。
進一步的,所述對所述初始情感標簽和所述初始情感數據進行雙向調整,獲得用于標識情感傾向的第一標簽和用于標識情感數據的第二標簽,包括以下:
采用第二神經網絡對帶有所述初始情感標簽和所述初始情感數據的第一分析數據進行處理,獲得第二分析數據;
采用softmax網絡對所述第二分析數據處理獲得第一標簽;
采用sigmoid網絡對所述第二分析數據處理獲得第二標簽。
進一步的,所述對所述待處理文本進行預處理,獲取第一處理數據,包括以下:
對所述待處理文本中的字根據預設長度向量進行初始化,獲得待處理文本中每個字對應的字向量;
將各個字向量集合獲得第一處理數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安國際智慧城市科技股份有限公司,未經平安國際智慧城市科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010906464.4/2.html,轉載請聲明來源鉆瓜專利網。





